昨天,谷歌的人工智能研究实验室 Google Deepmind 推出了备受期待的模型 Gemini,据报道,该模型在主要基准测试中的表现优于 OpenAI 的 GPT-4。
自从 OpenAI 一年前推出 ChatGPT 以来,领先的科技公司就陷入了 AI 进步的竞赛中。 到目前为止,Microsoft作为人工智能公司的主要投资者,由于收购了OpenAI的模型,股价略有上涨。 谷歌 Bard(ChatGPT 的竞争对手)的初始版本平淡无奇。 谷歌通常落后于OpenAI和Microsoft。 然而,Google Gemini 可能是向前迈出的一大步,可能会超越 OpenAI。
根据谷歌的说法,Gemini 之所以如此出色,是因为它具有多模态功能、复杂的推理和先进的编码能力。 与其他先基于文本构建然后添加图像数据的多模态 AI 模型不同,Gemini 原生是多模态的。 这意味着除了文本之外,它从一开始就对音频和图像模态进行了预训练。 “这有助于Gemini从头开始无缝地理解和推理各种输入,远远优于现有的多模态模型,”他说
Gemini 在 MMLU(大规模多任务语言理解)上得分为 90%,而 GPT-4 得分为 86 分4%,MMLU测试多学科知识和解决问题的能力。
谷歌已经针对三种不同的尺寸优化了 Gemini:Gemini Ultra,用于高度复杂任务的最大型号,Gemini Pro,一种能够完成大多数其他任务的中量级型号,以及 Gemini Nano,一种足够小的高效型号,可以放在你的手机上。
Gemini Nano 将在 Google Pixel 8 Pro 手机上运行。 明年,谷歌计划发布由 Gemini Ultra 提供支持的 Bard 高级版本。