有网友怀疑,谷歌史上最强大的模型双子座,可能还是GPT 4的幕后黑手!

小夏 历史 更新 2024-01-28

当广大网友都在关注OpenAI的ChatGPT和Microsoft的Copilot时,谷歌显然也不甘示弱,也在加紧开发更先进的大语言模型,希望尽快改变自己在人工智能AI领域落后一步的局面。 而就在昨晚,谷歌终于迫不及待地推出了新的多模态大模型Gemini,这是该公司迄今为止功能最强大、用途最广泛的大模型,它不仅可以处理包括文本、**图像、音频**在内的信息,还可以在包括数据中心和智能手机在内的所有设备上高效运行。

根据网上流传的一份飞书文件,在全球排名前100的AI产品中,按用户访问量从高到低的顺序排列,今年10月,OpenAI旗下的ChatGPT以17亿次的访问量排名第一Microsoft的新 Bing (Copilot) 以 13 亿次访问量位居第二谷歌的吟游诗人以 2 次访问排名第四67亿;谷歌投资的 Claude 以 2500 万次访问排名第 21 位。 单从用户流量来看,那么谷歌确实最有能力挑战OpenAI的领先地位。 也就是说,只要谷歌的AI模型足够强大,与OpenAI的差距越来越小,甚至超过OpenAI,那么市场形势就会越来越有利于谷歌。 毕竟,谷歌的产品,包括搜索、地图、邮箱、浏览器、移动服务等,不仅在全球拥有极其庞大的用户,而且是很多很多用户的首选。

这一次,谷歌的第一个 1Gemini 版本 0 有三种尺寸可供选择: Gemini Ultra 是用于处理高度复杂任务的最大和最强大的型号。 Gemini Pro 是一款能够处理多种任务类型的型号。 Gemini Nano 是一种可以在智能手机等设备上运行并处理任务的模型。

Gemini Ultra距离正式发布还有几个月的时间,目前正在接受全面的信任和安全检查,包括由值得信赖的外部合作者进行的红队审查,以及通过微调和基于人类反馈的强化学习(RLHF)不断改进。 Gemini Pro 和 Gemini Nano 已分别集成到 AI 聊天机器人 Bard 和智能手机 Pixel 8 Pro 中。 此外,从 12 月 13 日开始,开发人员和企业客户将能够通过 Google AI Studio 或 Google Cloud Vertex AI 中的 Gemini API 访问 Gemini Pro 模型。 在接下来的几个月里,Gemini 将进入谷歌的更多产品和服务,包括搜索、广告、Chrome 和 Duet AI。

许多网民最关心的是双子座是否超越GPT-4根据谷歌自己公布的测试结果,Gemini Ultra 在大型语言模型 (LLM) 开发领域的 32 个常见学术基准中创造了 30 项新的最佳记录,从自然图像、音频和理解到数学推理。 在 MMLU(大规模多任务语言理解)中,Gemini Ultar 获得了高达 90 分的分数0%,成为第一个超越人类专家的模型。 该测试结合了 57 个科目,包括数学、物理、历史、法律、医学和伦理学,旨在测试 AI 模型的知识和解决问题的能力。 在包括文本和编码在内的一系列基准测试中,Gemini Ultra 的表现优于 GPT-4。 在一系列多模态基准测试中,Gemini Ultra 创造了新的性能记录,全面超越了 GPT-4 Vision。 无论如何,谷歌自称是最强的双子座 Ultar,用户实际上无法亲自参与测试体验来验证其真实能力和水平。

Gemini Ultar 在一系列基准测试中的表现优于 GPT-4,包括文本和编码

Gemini 在一系列多模态基准测试中创造了新的性能记录,全面优于 GPT-4V

有网友表示,即使谷歌的Gemini Ultra机型在多项指标上都处于领先地位,但也不代表它是最好的机型。 我们必须等到它向用户开放进行测试,然后才能知道它是否更好,或者它是否真的超过了 OpenAI 的 ChatGPT-4。 另一位网友表示,无论 Gemini 能否超越 GPT-4,只要能给 OpenAI 带来一些压力,那就是一件好事!这样一来,OpenAI 很可能会更早发布比 GPT-4 更强的模型——GPT-5。

而谷歌在聊天机器人 Bard 上部署的 Gemini Pro 应该大致相当于 ChatGPT-35。chatgpt-3.5 已经支持多种语言,但 Gemini Pro 仅支持英语。 如果有人想亲自尝试 Gemini Pro,他们需要用英语与之交谈。 可以说,即使是由 Gemini Pro 提供支持的 Bard,对许多用户仍然没有太大的吸引力。

通过对目前 Gemini Pro 支持的 Bard 做一些简单的测试,主要看它的数学能力和编码能力。 初步结论是,无论是在数学能力还是编码能力上,ChatGPT-35 比吟游诗人好。 有兴趣的网友可以带着以下问题自己试试,(因为截图太长,很难看清上面的内容,所以就不粘贴截图了)。

这三个数学问题如下:

1)已知1+2=12,1+2+3=123,1+2+3+5=1235,根据这个定律,那么1+2+3+5+7应该等于什么?

2)9﹣1=8,16﹣4=12,25﹣9=16,36﹣16=20,…用字母 n(n 是正整数)表示您在公式中找到的模式。

3)小明和小红是邻居,他们打算一起去附近的农场买新鲜水果。汤姆决定买苹果和橙子,而瑞德只打算买橙子。 农场里的苹果和橙子都是按公斤出售的,而且是不同的。

已知:小明买了2公斤苹果和1公斤橙子,共花了70元。 小红买了2公斤橙子,一共花了50元。

每公斤苹果和橙子的**是多少?如果小明用同样的总量买橘子,他能买到多少公斤?

通过对比测试结果,ChatGPT-35. 我把第一道和第三道数学题答对了,吟游诗人把三道数学题都答错了。

这两个**主题如下:

1)编写一个Python程序,该程序使用matplotlib库创建太阳系的简单动画。太阳系模型应包括太阳和至少三颗行星(例如地球、火星和木星)。 每颗行星都应该以不同的轨道半径和速度围绕太阳旋转。

要求:以圆圈表示太阳和单个行星,大小按比例设置。

每颗行星的轨道都应该是一个圆圈,轨道半径是根据实际太阳系的比例来设定的。

行星绕太阳公转的速度也应根据其轨道周期的实际比例来设定。

动画应该是无限循环的,行星在轨道上的运动应该是平滑的。

可选)为动画添加背景,例如星空或其他科幻风格的背景。

2)实现自定义向量类。

任务是在 C++ 中实现一个自定义向量类 MyVector,它应该模仿标准库中的 std::vector。 此类应支持以下功能:

构造函数:创建具有指定初始大小的向量,并选择性地接受初始值。

回推方法:在向量末尾添加一个新元素。

size 方法:返回向量中的元素数。

capacity 方法:返回可以保存在向量中的元素数,而不必重新分配。

operator:允许通过索引访问向量中的元素。

复制构造函数:实现深度复制。

赋值运算符:确保正确的复制语义。

析构函数:适当释放资源。

要求:使用原始指针动态管理数组。

确保遵循良好的内存管理和异常安全做法。

不要使用 std::vector 或标准库中的其他容器。

奖励挑战:实现调整大小方法,更改矢量的大小,并在需要时初始化新元素。

实现预留方法以预分配空间,以优化添加新元素的性能。

通过比较测试结果,我们忽略 chatgpt-35 和吟游诗人各自写了 ** 正确与否,总体感觉像 chatgpt-35 相对更好。

总结:谷歌要想全面战胜OpenAI,绝对是轻而易举的。

我正在整理技术怪胎的版本)。

相似文章

    牧野:说一些实际的话,说一些真诚的话

    读者在这个星球上问得最多的问题有三类,第一类是房产的选择,第二类是对宏观形势的讨论,第三类是职场的迷茫。说实话,我不是职场的专业人士,相反,我是一个边缘人物,一个边缘人物,但我对自己有很清醒的认识,我的性格就是这样,我的年龄在这里,优缺点非常突出,宣传我的长处和短处可能是更好的选择。我能看到一些东西...

    黄花梨的一些知识

    黄花梨,一个充满神秘和魅力的名字,是中国传统家具中最珍贵的木材之一。它质地细腻,色彩鲜艳,具有极高的收藏价值和艺术价值。然而,对于大多数人来说,黄花梨可能仍然是一个陌生的名字。今天,我们将带大家通过一系列的介绍,领略一下黄花丽的魅力。黄花杨,又称檀香,是一种原产于中国海南和越南的稀有树种。它的成长周...

    初学者学习古琴的一些建议

    古琴作为中国传统文化的重要组成部分,以其独特的音色和丰富的内涵赢得了越来越多人的喜爱。然而,对于许多初学者来说,如何开始学习古琴习是一个难题。本文将习古琴学习的基本步骤和方法,以帮助读者更好地体会古琴的魅力。 了解古琴的基本知识。在开始学习习古琴之前,有必要了解古琴的基础知识。古琴的结构 历史 传承...

    保险研究院的一些经验分享

    有些高校很适合进入夏令营,可以通过提交材料进入,这可能是因为海王很多高校都怕被鸽子,当然需要特别注意面试,尽量展示自己,阵营里人太多了,我们需要保证自己的排名非常靠前,这样才能保证我们能拿到offer。.有些夏令营没有面试,只有讲座 政策介绍等,但还是会奖励优秀的营员,他们会在后期的预升免中接受面试...

    但我可以帮助您入门

    对不起,我无法提供超过一千字的连续文本。但我可以帮助您入门您可以扩展此段落并根据需要编写更多内容。开幕式 有时,历史不仅仅是一堆事实和事件,它充满了情感和激烈的观点。我们谈论历史,不仅是为了回顾过去,也是为了将我们的情感和思想融入那些看似遥远却永恒的篇章中。对于一个国家来说,历史是一面镜子,反映着它...