当广大网友都在关注OpenAI的ChatGPT和Microsoft的Copilot时,谷歌显然也不甘示弱,也在加紧开发更先进的大语言模型,希望尽快改变自己在人工智能AI领域落后一步的局面。 而就在昨晚,谷歌终于迫不及待地推出了新的多模态大模型Gemini,这是该公司迄今为止功能最强大、用途最广泛的大模型,它不仅可以处理包括文本、**图像、音频**在内的信息,还可以在包括数据中心和智能手机在内的所有设备上高效运行。
根据网上流传的一份飞书文件,在全球排名前100的AI产品中,按用户访问量从高到低的顺序排列,今年10月,OpenAI旗下的ChatGPT以17亿次的访问量排名第一Microsoft的新 Bing (Copilot) 以 13 亿次访问量位居第二谷歌的吟游诗人以 2 次访问排名第四67亿;谷歌投资的 Claude 以 2500 万次访问排名第 21 位。 单从用户流量来看,那么谷歌确实最有能力挑战OpenAI的领先地位。 也就是说,只要谷歌的AI模型足够强大,与OpenAI的差距越来越小,甚至超过OpenAI,那么市场形势就会越来越有利于谷歌。 毕竟,谷歌的产品,包括搜索、地图、邮箱、浏览器、移动服务等,不仅在全球拥有极其庞大的用户,而且是很多很多用户的首选。
这一次,谷歌的第一个 1Gemini 版本 0 有三种尺寸可供选择: Gemini Ultra 是用于处理高度复杂任务的最大和最强大的型号。 Gemini Pro 是一款能够处理多种任务类型的型号。 Gemini Nano 是一种可以在智能手机等设备上运行并处理任务的模型。
Gemini Ultra距离正式发布还有几个月的时间,目前正在接受全面的信任和安全检查,包括由值得信赖的外部合作者进行的红队审查,以及通过微调和基于人类反馈的强化学习(RLHF)不断改进。 Gemini Pro 和 Gemini Nano 已分别集成到 AI 聊天机器人 Bard 和智能手机 Pixel 8 Pro 中。 此外,从 12 月 13 日开始,开发人员和企业客户将能够通过 Google AI Studio 或 Google Cloud Vertex AI 中的 Gemini API 访问 Gemini Pro 模型。 在接下来的几个月里,Gemini 将进入谷歌的更多产品和服务,包括搜索、广告、Chrome 和 Duet AI。
许多网民最关心的是双子座是否超越GPT-4根据谷歌自己公布的测试结果,Gemini Ultra 在大型语言模型 (LLM) 开发领域的 32 个常见学术基准中创造了 30 项新的最佳记录,从自然图像、音频和理解到数学推理。 在 MMLU(大规模多任务语言理解)中,Gemini Ultar 获得了高达 90 分的分数0%,成为第一个超越人类专家的模型。 该测试结合了 57 个科目,包括数学、物理、历史、法律、医学和伦理学,旨在测试 AI 模型的知识和解决问题的能力。 在包括文本和编码在内的一系列基准测试中,Gemini Ultra 的表现优于 GPT-4。 在一系列多模态基准测试中,Gemini Ultra 创造了新的性能记录,全面超越了 GPT-4 Vision。 无论如何,谷歌自称是最强的双子座 Ultar,用户实际上无法亲自参与测试体验来验证其真实能力和水平。
Gemini Ultar 在一系列基准测试中的表现优于 GPT-4,包括文本和编码
Gemini 在一系列多模态基准测试中创造了新的性能记录,全面优于 GPT-4V
有网友表示,即使谷歌的Gemini Ultra机型在多项指标上都处于领先地位,但也不代表它是最好的机型。 我们必须等到它向用户开放进行测试,然后才能知道它是否更好,或者它是否真的超过了 OpenAI 的 ChatGPT-4。 另一位网友表示,无论 Gemini 能否超越 GPT-4,只要能给 OpenAI 带来一些压力,那就是一件好事!这样一来,OpenAI 很可能会更早发布比 GPT-4 更强的模型——GPT-5。
而谷歌在聊天机器人 Bard 上部署的 Gemini Pro 应该大致相当于 ChatGPT-35。chatgpt-3.5 已经支持多种语言,但 Gemini Pro 仅支持英语。 如果有人想亲自尝试 Gemini Pro,他们需要用英语与之交谈。 可以说,即使是由 Gemini Pro 提供支持的 Bard,对许多用户仍然没有太大的吸引力。
通过对目前 Gemini Pro 支持的 Bard 做一些简单的测试,主要看它的数学能力和编码能力。 初步结论是,无论是在数学能力还是编码能力上,ChatGPT-35 比吟游诗人好。 有兴趣的网友可以带着以下问题自己试试,(因为截图太长,很难看清上面的内容,所以就不粘贴截图了)。
这三个数学问题如下:
1)已知1+2=12,1+2+3=123,1+2+3+5=1235,根据这个定律,那么1+2+3+5+7应该等于什么?通过对比测试结果,ChatGPT-35. 我把第一道和第三道数学题答对了,吟游诗人把三道数学题都答错了。2)9﹣1=8,16﹣4=12,25﹣9=16,36﹣16=20,…用字母 n(n 是正整数)表示您在公式中找到的模式。
3)小明和小红是邻居,他们打算一起去附近的农场买新鲜水果。汤姆决定买苹果和橙子,而瑞德只打算买橙子。 农场里的苹果和橙子都是按公斤出售的,而且是不同的。
已知:小明买了2公斤苹果和1公斤橙子,共花了70元。 小红买了2公斤橙子,一共花了50元。
每公斤苹果和橙子的**是多少?如果小明用同样的总量买橘子,他能买到多少公斤?
这两个**主题如下:
1)编写一个Python程序,该程序使用matplotlib库创建太阳系的简单动画。太阳系模型应包括太阳和至少三颗行星(例如地球、火星和木星)。 每颗行星都应该以不同的轨道半径和速度围绕太阳旋转。通过比较测试结果,我们忽略 chatgpt-35 和吟游诗人各自写了 ** 正确与否,总体感觉像 chatgpt-35 相对更好。要求:以圆圈表示太阳和单个行星,大小按比例设置。
每颗行星的轨道都应该是一个圆圈,轨道半径是根据实际太阳系的比例来设定的。
行星绕太阳公转的速度也应根据其轨道周期的实际比例来设定。
动画应该是无限循环的,行星在轨道上的运动应该是平滑的。
可选)为动画添加背景,例如星空或其他科幻风格的背景。
2)实现自定义向量类。
任务是在 C++ 中实现一个自定义向量类 MyVector,它应该模仿标准库中的 std::vector。 此类应支持以下功能:
构造函数:创建具有指定初始大小的向量,并选择性地接受初始值。
回推方法:在向量末尾添加一个新元素。
size 方法:返回向量中的元素数。
capacity 方法:返回可以保存在向量中的元素数,而不必重新分配。
operator:允许通过索引访问向量中的元素。
复制构造函数:实现深度复制。
赋值运算符:确保正确的复制语义。
析构函数:适当释放资源。
要求:使用原始指针动态管理数组。
确保遵循良好的内存管理和异常安全做法。
不要使用 std::vector 或标准库中的其他容器。
奖励挑战:实现调整大小方法,更改矢量的大小,并在需要时初始化新元素。
实现预留方法以预分配空间,以优化添加新元素的性能。
总结:谷歌要想全面战胜OpenAI,绝对是轻而易举的。
我正在整理技术怪胎的版本)。