谷歌希望通过发布 Gemini 来赶上 OpenAI

当谈到当前人工智能热潮背后的技术时，Alphabet Inc.的谷歌实际上是发明者，但其产品的受欢迎程度已经明显滞后。这家搜索引擎巨头希望通过发布备受期待的双子座来改变这种状况，这是该公司迄今为止建立的“最大、最强大的工人智能模型”。

自从 OpenAI 去年凭借其对话式聊天机器人 ChatGPT 取得巨大成功以来，越来越多的公司一直在尝试生成式 AI，这是一种可以自动执行编码、总结报告或根据用户要求创建营销活动等任务的技术。在 12 月 6 日发布前的演示中，谷歌强调 Gemini 是它构建的最灵活的型号，因为它有不同尺寸的版本，包括直接在智能手机上运行的版本。这使它有别于其他竞争对手。

该 AI 模型是一个旨在支持各种生成式 AI 应用程序的系统，它有三个不同的版本：Gemini Ultra、Gemini Pro 和 Gemini Nano。谷歌DeepMind部门产品副总裁Eli Collins表示，这种多样性意味着Gemini“能够在从移动设备到大型数据中心的所有设备上运行”。

长期以来，我们一直希望构建新一代的人工智能模型，其灵感来自人们理解世界和与世界互动的方式——一种感觉更像是一个有用的合作者，而不是一个智能软件，“柯林斯在接受记者采访时说。 ”

在该模型发布之前，该公司对 Gemini 进行了一系列标准的行业基准测试，并表示八项测试中有六项表明 Gemini Pro 的性能优于 OpenAI 的 GPT-35。谷歌声称，在通用语言理解、推理、数学和编码方面进行的八项基准测试中，有七项优于 OpenAI 通用模型的最新版本 GPT-4。与此同时，谷歌估计，该公司最新的可解释和生成**生成式人工智能产品alphacode 2在竞争激烈的编程领域表现优于85%的竞争对手。该公司将发布一份技术报告，更深入地解释 Gemini 的模型架构、训练过程和评估。

从 12 月 6 日开始，想要为智能手机和平板电脑编写 Gemini 驱动的应用程序的 Android 开发人员将能够注册使用直接在此类设备上运行的 AI 模型的“纳米”版本。谷歌还表示，将立即在其旗舰手机 Pixel 8 Pro 上启用 Gemini，并将支持新的生成式 AI 功能，例如从**录音中总结点。下周，谷歌将通过其Vertex AI和AI Studio平台向云客户提供Gemini Pro。

Gemini Ultra 是谷歌 AI 模型的最大版本，最初将在面向开发人员和企业公司的抢先体验计划中提供，有关该计划的详细信息将于下周公布。该版本将于明年初向公众广泛提供。

Gemini 还可以通过 Bard 与谷歌的大量应用程序和服务集成，Bard 是该公司的对话式聊天机器人，是 ChatGPT 的竞争对手。此前，Bard 使用了谷歌的 Palm 2 模型，这是该公司在 5 月份的年度开发者大会上宣布的大型语言模型。

在过去的一年里，谷歌一直面临着重塑其核心搜索业务和应对一波生成式人工智能程序的压力。虽然该公司长期以来一直被视为人工智能研究的先驱，但一些人批评其管理层在营销人工智能产品时反应迟钝，尤其是在 ChatGPT 和图像生成器 Dall-E 等产品取得成功之后。自 OpenAI 于 3 月发布 GPT-4 以来，谷歌一直在努力重新确立其在该领域的领导地位，包括将这项新技术注入其已建立的搜索业务。

Gemini 是该公司应对这一市场压力的答案。谷歌表示，人工智能模型是“自然多模态的”，这意味着它从一开始就经过了预训练，可以处理来自用户的基于文本和图像的提示。例如，在一个演示中，谷歌展示了父母如何通过上传数学问题的图像并在草稿纸上尝试解决该问题的步骤来帮助孩子完成家庭作业。

在演示**中，谷歌软件工程师泰勒·阿普尔鲍姆（Taylor Applebaum）表示，“Gemini 不仅可以解决这些问题，还可以阅读答案，了解什么是对的，什么是错的，并解释需要进一步澄清的概念。该公司还表示，其“搜索生成体验”——使用其生成式人工智能技术构建的谷歌搜索引擎的实验版本——将在明年整合Gemini的新功能。

尽管如此，该公司的代表警告说，Gemini仍然容易产生“幻觉”，即生成式AI产生的虚假或捏造信息。柯林斯称这种现象为“一个未解决的研究问题”。该公司向记者展示的演示文稿**是预先录制的。

柯林斯表示，Gemini“拥有谷歌所有人工智能模型中最全面的安全评估。他说，为了评估Gemini的安全性，谷歌对AI模型进行了对抗性测试，模仿了一个试图利用该程序的坏人。该测试包括“真正的毒性提示”，这是一项由艾伦人工智能研究所开发的测试，其中包含从网络中提取的100,000多个提示，以帮助人工智能研究人员检查大型语言模型中的仇恨言论和政治偏见。

谷歌还强调，这个工具的速度会很快。该公司表示，Gemini 使用新的底层超级计算机架构和更新的处理芯片，使其运行速度比早期的小型型号更快。谷歌正在使用其云芯片的新版本，即云张量处理单元（TPUS），这是一种内部设计的芯片，训练现有模型的速度比其前身快2.28次。谷歌机器科学习副总裁阿明·瓦赫达特（Amin Vahdat）表示，这种方法为谷歌提供了“对未来标准人工智能基础设施的新视角”。他补充说，该公司仍将使用第三方AI芯片来运行其Gemini模型。

Gemini 将集成到谷歌 3 月推出的生成式 AI 聊天机器人 Bard 中，使其能够利用该公司最受欢迎的服务，包括 Gmail、地图、Docs 和 YouTube。推出将分两个不同的阶段进行：从 12 月 6 日开始，Bard 将由 Gemini Pro 提供支持，这将支持高级推理、计划、理解和其他功能。它将能够在 170 个国家和地区以英语运营，但值得注意的是，欧洲或英国不包括在内，该公司表示正在与当地监管机构进行谈判。

明年年初，该公司打算发布Bard Advanced，它将由更强大的Gemini Ultra型号提供动力。谷歌表示，它将很快推出一个值得信赖的测试器，以改进Bard Advanced，然后再向公众广泛使用。

谷歌Bard产品副总裁Sissie Hsiao表示：“通过Gemini，Bard正在进行迄今为止最大和最好的升级，为人们创造、互动和协作开辟了新的方式。 ”

本文来源：金融界。

谷歌希望通过发布 Gemini 来赶上 OpenAI

相似文章

谷歌发布AI模型双子座小公主还没长大，就被逼出内阁

谷歌发布了 Gemini，并在全球 AI 竞赛中投入了更多资金，我是这样看的

谷歌的 Gemini 1 0 大模型几乎全面领先于 GPT 4 发布

谷歌Gemini的发布将人工智能带入了一个新时代

谷歌最强AI模型Gemini正式发布了三个版本的多模态

谷歌希望通过发布 Gemini 来赶上 OpenAI

相似文章

谷歌发布AI模型双子座 小公主还没长大，就被逼出内阁

谷歌发布了 Gemini，并在全球 AI 竞赛中投入了更多资金，我是这样看的

谷歌的 Gemini 1 0 大模型几乎全面领先于 GPT 4 发布

谷歌Gemini的发布将人工智能带入了一个新时代

谷歌最强AI模型Gemini正式发布了三个版本的多模态

谷歌发布AI模型双子座小公主还没长大，就被逼出内阁