2023年,ChatGPT日渐成长,这个**AI工具现在已经广为人知,人们一直期待一个强大的竞争对手来挑战它。 OpenAI 的主要竞争对手谷歌在发布后不久就开始开发一款名为 ChatGPT 的人工智能工具。
众所周知,ChatGPT要充分发挥其功能,核心在于依靠GPT-4这一关键技术的支持。 GPT-4 是一个大型语言模型,它在互联网上的数十亿组数据上进行训练,以掌握图像、文本和上下文等许多元素,使其能够发挥作用。 在过去的一年里,Bard 对文本、音频、图像和其他形式的内容有了广泛的了解。 其训练数据包括大量的书籍、文章、图书馆、录音等多样化资源,就像GPT-4一样,Bard也实现了对语言文本的泛化理解,为用户提供了有效的答案和支持。
快进到 2024 年 2 月初,一份泄露的文件显示,人工智能 Bard 将迎来全面的重大版本更新,不仅在性能上实现了飞跃,而且还有了新的名字,双子座。
Gemini 继承自 Bard,也是多模态、多任务、多语言的,可以处理多种数据类型,包括文本、图像等,可以理解和生成各种内容。 比起吟游诗人,双子座更聪明,不仅学会了写一个完整的**,还学会了理解人类文本的逻辑,展现出自己独特的创造力。
在谷歌对Gemini各种技术的介绍中,有这样一段话**。 双子座不仅可以实时描绘各种物体,还可以详细解释它们。 更难得的是,双子座可以回答人类关于它所画物体的各种问题,用多种语言交流,甚至可以根据它绘制的图像设计游戏。
然而,虽然这些内容令人信服,但它仍然有些误导。 事实上,双子座不会实时回答人们的问题。 更要做的是结合人类给出的提示来分析问题答案的上下文。
在另一个演示**中,Gemini识别图像组合的能力也得到了增强。 对象向双子座展示了一个带有培根**的煎饼和一个在嘉年华会上跳舞的人偶,并让他猜出电影的标题,双子座能够准确地回答这是早餐俱乐部。
此外,双子座可以确定适合不同类型服装的天气和场合,找到不同文字和图像之间的关联,并帮助孩子完成数学作业。 可以说,Gemini 在文本、图像和各种数字内容方面的潜力是无穷无尽的。
那么,谷歌辛辛苦苦打造的这个双子座,能否在2024年击败GPT-4,成为ChatGPT最大的竞争对手呢?
目前,还有待商榷。 以上功能并不新鲜,OpenAI 也尝试过 GPT-4,并且表现相当不错。
然而,谷歌似乎并不这么认为,在其产品声明中,它认为 Gemini 在用于评估模型的知识、推理、感知和其他能力的 32 个类别中的 30 个类别中击败了 GPT-4。 它还获得了 90% 的分数,使其成为第一个在大规模多任务语言理解测试中表现优于人类专家的模型。 双子座还可以整合数学、物理、历史、法律、伦理、医学等57个学科,运用各种知识协同解决问题。
当然,以上所有数据都属于谷歌的吹嘘,无法确认双子座在受控测试之外的表现如何。 相较于全球网友广泛使用的ChatGPT,谷歌仍在缓慢但稳步地推进测试,规模可控。 看来,对于“双子座要和ChatGPT竞争”的问题,至少谷歌目前还是害怕的。
文本:世界上的企业家精神 - rainyproject