本文引自《哈佛商业评论》2024年第1期《商业的未来:英伟达CEO谈人工智能公司如何运作》。
生成式 AI其核心是“软件理解数据含义的能力”。。当然,您可以理解单词、字母、短语、句子和段落的含义,并找出其中的含义关系跟使用模式。从大量的例子中,可以识别和学习数据的呈现方式甚至了解其含义
人工智能也理解这一点消息的结构和含义。这适用于:语言、像素、三维物体、蛋白质物体和化学物质。现在,我们已经能够使用它了深度学习方法加油了解如何表达大量不同类型的数据,甚至任何具有结构的数据。因为在物质世界里,在我们生活的世界里,有很多东西是结构化的。
一旦我们理解了数据的含义,以及将一种模式与另一种模式联系起来的能力你可以继续”。译本”。例如,我们可以将图像中表示“猫”的像素与单词“猫”相关联。 之后,我们可以将英文翻译成中文,也可以将中文翻译成法文。 当我们从英语翻译成像素时,我们就变成了生成式人工智能; 当我们从像素翻译成语言时,它就变成了字幕。 我们还可以将文本翻译成文本摘要等。
这种我学习了数据表示的基本模型它非常强大。 人工智能行业和计算机行业现在正在做的是将这些生成和转换方法整合到各种有趣的应用中。我认为,这种兴奋的核心是学习表征、学习意义以及从一种模式切换到另一种模式的能力,这是非常强大的。
人工智能最有用的功能之一是增强检索,无论数据库是结构化的还是非结构化的,以数据库的形式还是非结构化的形式都已矢量化。矢量化或嵌入数据库需要您了解数据之间的所有关系,就像我之前所说的学习数据的表示一样。 通过学习符号和学习数据库的矢量化,您将能够理解它的含义。 而现在,真正令人兴奋的是,您可以矢量化数据库并将其连接到大型语言模型,这基本上可以让您与数据通信
每家公司都有很多数据,但其中大多数数据处于休眠状态,这很难使用。 有时您必须查询大量数据才能使用它。 但现在,您可以拥有一个真正了解其含义的数据库。您可以在数据库中进行语义搜索。 它显示要查询的信息,然后你可以利用该嵌入,并使用引入的模型对数据的提示来增强该嵌入。 这样,提供给 AI 提示的上下文和背景信息就更丰富了。 现在,由于大型语言模型能够理解您在说什么,因此与应用程序交互变得相当普遍和容易。
现在可以对所有数据库进行矢量化,以增强提示和查询。人工智能在内部的使用方式真是太神奇了。 当然,最有趣的事情之一是,如果你是一家拥有大型客户服务部门的公司,客户服务人员在与客户的互动中输入——无论是问题、投诉还是帮助客户的方式——所有这些都以某种方式记录在一个非常大的数据库中。 如果你把这个数据库矢量化,这样你就可以直接与数据库对话,那不是很神奇吗? 我们可以问数据库:客户最不满意的是什么? 我们可以看到哪些趋势? 如果我们想改善公司的客户服务,我们可以开始做两三件事? 你可以像与一个人交谈一样与你的数据库交谈,这真的很强大。
人工智能令人兴奋的核心是能够学习表征、学习意义以及从一种模式过渡到另一种模式,这非常强大。