有网友怀疑，谷歌史上最强大的模型双子座，可能还是GPT 4的幕后黑手！

当广大网友都在关注OpenAI的ChatGPT和Microsoft的Copilot时，谷歌显然也不甘示弱，也在加紧开发更先进的大语言模型，希望尽快改变自己在人工智能AI领域落后一步的局面。而就在昨晚，谷歌终于迫不及待地推出了新的多模态大模型Gemini，这是该公司迄今为止功能最强大、用途最广泛的大模型，它不仅可以处理包括文本、**图像、音频**在内的信息，还可以在包括数据中心和智能手机在内的所有设备上高效运行。

根据网上流传的一份飞书文件，在全球排名前100的AI产品中，按用户访问量从高到低的顺序排列，今年10月，OpenAI旗下的ChatGPT以17亿次的访问量排名第一Microsoft的新 Bing （Copilot）以 13 亿次访问量位居第二谷歌的吟游诗人以 2 次访问排名第四67亿;谷歌投资的 Claude 以 2500 万次访问排名第 21 位。单从用户流量来看，那么谷歌确实最有能力挑战OpenAI的领先地位。也就是说，只要谷歌的AI模型足够强大，与OpenAI的差距越来越小，甚至超过OpenAI，那么市场形势就会越来越有利于谷歌。毕竟，谷歌的产品，包括搜索、地图、邮箱、浏览器、移动服务等，不仅在全球拥有极其庞大的用户，而且是很多很多用户的首选。

这一次，谷歌的第一个 1Gemini 版本 0 有三种尺寸可供选择： Gemini Ultra 是用于处理高度复杂任务的最大和最强大的型号。 Gemini Pro 是一款能够处理多种任务类型的型号。 Gemini Nano 是一种可以在智能手机等设备上运行并处理任务的模型。

Gemini Ultra距离正式发布还有几个月的时间，目前正在接受全面的信任和安全检查，包括由值得信赖的外部合作者进行的红队审查，以及通过微调和基于人类反馈的强化学习（RLHF）不断改进。 Gemini Pro 和 Gemini Nano 已分别集成到 AI 聊天机器人 Bard 和智能手机 Pixel 8 Pro 中。此外，从 12 月 13 日开始，开发人员和企业客户将能够通过 Google AI Studio 或 Google Cloud Vertex AI 中的 Gemini API 访问 Gemini Pro 模型。在接下来的几个月里，Gemini 将进入谷歌的更多产品和服务，包括搜索、广告、Chrome 和 Duet AI。

许多网民最关心的是双子座是否超越GPT-4根据谷歌自己公布的测试结果，Gemini Ultra 在大型语言模型（LLM）开发领域的 32 个常见学术基准中创造了 30 项新的最佳记录，从自然图像、音频和理解到数学推理。在 MMLU（大规模多任务语言理解）中，Gemini Ultar 获得了高达 90 分的分数0%，成为第一个超越人类专家的模型。该测试结合了 57 个科目，包括数学、物理、历史、法律、医学和伦理学，旨在测试 AI 模型的知识和解决问题的能力。在包括文本和编码在内的一系列基准测试中，Gemini Ultra 的表现优于 GPT-4。在一系列多模态基准测试中，Gemini Ultra 创造了新的性能记录，全面超越了 GPT-4 Vision。无论如何，谷歌自称是最强的双子座 Ultar，用户实际上无法亲自参与测试体验来验证其真实能力和水平。

Gemini Ultar 在一系列基准测试中的表现优于 GPT-4，包括文本和编码

Gemini 在一系列多模态基准测试中创造了新的性能记录，全面优于 GPT-4V

有网友表示，即使谷歌的Gemini Ultra机型在多项指标上都处于领先地位，但也不代表它是最好的机型。我们必须等到它向用户开放进行测试，然后才能知道它是否更好，或者它是否真的超过了 OpenAI 的 ChatGPT-4。另一位网友表示，无论 Gemini 能否超越 GPT-4，只要能给 OpenAI 带来一些压力，那就是一件好事！这样一来，OpenAI 很可能会更早发布比 GPT-4 更强的模型——GPT-5。

而谷歌在聊天机器人 Bard 上部署的 Gemini Pro 应该大致相当于 ChatGPT-35。chatgpt-3.5 已经支持多种语言，但 Gemini Pro 仅支持英语。如果有人想亲自尝试 Gemini Pro，他们需要用英语与之交谈。可以说，即使是由 Gemini Pro 提供支持的 Bard，对许多用户仍然没有太大的吸引力。

通过对目前 Gemini Pro 支持的 Bard 做一些简单的测试，主要看它的数学能力和编码能力。初步结论是，无论是在数学能力还是编码能力上，ChatGPT-35 比吟游诗人好。有兴趣的网友可以带着以下问题自己试试，（因为截图太长，很难看清上面的内容，所以就不粘贴截图了）。

这三个数学问题如下：

1）已知1+2=12,1+2+3=123,1+2+3+5=1235，根据这个定律，那么1+2+3+5+7应该等于什么？

2）9﹣1=8，16﹣4=12，25﹣9=16，36﹣16=20，…用字母 n（n 是正整数）表示您在公式中找到的模式。

3）小明和小红是邻居，他们打算一起去附近的农场买新鲜水果。汤姆决定买苹果和橙子，而瑞德只打算买橙子。农场里的苹果和橙子都是按公斤出售的，而且是不同的。

已知：小明买了2公斤苹果和1公斤橙子，共花了70元。小红买了2公斤橙子，一共花了50元。

每公斤苹果和橙子的**是多少？如果小明用同样的总量买橘子，他能买到多少公斤？

通过对比测试结果，ChatGPT-35. 我把第一道和第三道数学题答对了，吟游诗人把三道数学题都答错了。

这两个**主题如下：

1）编写一个Python程序，该程序使用matplotlib库创建太阳系的简单动画。太阳系模型应包括太阳和至少三颗行星（例如地球、火星和木星）。每颗行星都应该以不同的轨道半径和速度围绕太阳旋转。

要求：以圆圈表示太阳和单个行星，大小按比例设置。

每颗行星的轨道都应该是一个圆圈，轨道半径是根据实际太阳系的比例来设定的。

行星绕太阳公转的速度也应根据其轨道周期的实际比例来设定。

动画应该是无限循环的，行星在轨道上的运动应该是平滑的。

可选）为动画添加背景，例如星空或其他科幻风格的背景。

2）实现自定义向量类。

任务是在 C++ 中实现一个自定义向量类 MyVector，它应该模仿标准库中的 std：：vector。此类应支持以下功能：

构造函数：创建具有指定初始大小的向量，并选择性地接受初始值。

回推方法：在向量末尾添加一个新元素。

size 方法：返回向量中的元素数。

capacity 方法：返回可以保存在向量中的元素数，而不必重新分配。

operator：允许通过索引访问向量中的元素。

复制构造函数：实现深度复制。

赋值运算符：确保正确的复制语义。

析构函数：适当释放资源。

要求：使用原始指针动态管理数组。

确保遵循良好的内存管理和异常安全做法。

不要使用 std：：vector 或标准库中的其他容器。

奖励挑战：实现调整大小方法，更改矢量的大小，并在需要时初始化新元素。

实现预留方法以预分配空间，以优化添加新元素的性能。

通过比较测试结果，我们忽略 chatgpt-35 和吟游诗人各自写了 ** 正确与否，总体感觉像 chatgpt-35 相对更好。

总结：谷歌要想全面战胜OpenAI，绝对是轻而易举的。

我正在整理技术怪胎的版本）。

有网友怀疑，谷歌史上最强大的模型双子座，可能还是GPT 4的幕后黑手！

相似文章

牧野：说一些实际的话，说一些真诚的话

黄花梨的一些知识

初学者学习古琴的一些建议

保险研究院的一些经验分享

但我可以帮助您入门