在 GPT4 之前，谷歌推出了 Gemini，称其为“最大、最有能力的 AI 模型”。

小夏科技更新 2024-01-28

昨天，谷歌的人工智能研究实验室 Google Deepmind 推出了备受期待的模型 Gemini，据报道，该模型在主要基准测试中的表现优于 OpenAI 的 GPT-4。

自从 OpenAI 一年前推出 ChatGPT 以来，领先的科技公司就陷入了 AI 进步的竞赛中。到目前为止，Microsoft作为人工智能公司的主要投资者，由于收购了OpenAI的模型，股价略有上涨。谷歌 Bard（ChatGPT 的竞争对手）的初始版本平淡无奇。谷歌通常落后于OpenAI和Microsoft。然而，Google Gemini 可能是向前迈出的一大步，可能会超越 OpenAI。

根据谷歌的说法，Gemini 之所以如此出色，是因为它具有多模态功能、复杂的推理和先进的编码能力。与其他先基于文本构建然后添加图像数据的多模态 AI 模型不同，Gemini 原生是多模态的。这意味着除了文本之外，它从一开始就对音频和图像模态进行了预训练。 “这有助于Gemini从头开始无缝地理解和推理各种输入，远远优于现有的多模态模型，”他说

Gemini 在 MMLU（大规模多任务语言理解）上得分为 90%，而 GPT-4 得分为 86 分4%，MMLU测试多学科知识和解决问题的能力。

谷歌已经针对三种不同的尺寸优化了 Gemini：Gemini Ultra，用于高度复杂任务的最大型号，Gemini Pro，一种能够完成大多数其他任务的中量级型号，以及 Gemini Nano，一种足够小的高效型号，可以放在你的手机上。

Gemini Nano 将在 Google Pixel 8 Pro 手机上运行。明年，谷歌计划发布由 Gemini Ultra 提供支持的 Bard 高级版本。

在 GPT4 之前，谷歌推出了 Gemini，称其为“最大、最有能力的 AI 模型”。

相似文章

超越 GPT 4！谷歌发布最强大的多模态大型模型 Gemini

这就是为什么人们说 GPT 4 变得“懒惰”的原因。

112 页的报告深入挖掘 GPT 4V！加州大学洛杉矶分校（UCLA）等人发布了MathVista，一个多模态数学推理基准