OpenAI与谷歌，AI上线飞行生活

公司何时才能赶上 OpenAI？这个问题，想必是一年多来萦绕在很多读者心中的迷茫。

如果世界上只有一家公司能赶上OpenAI，谷歌应该是最有前途的玩家。

同为北美AI巨头的谷歌，拥有与OpenAI相同的AGI目标、世界一流的技术人才、全球财力，甚至OpenAI大模型的核心Transformer架构，都是谷歌原创的。

然而，从2023年到现在，AI领域一直动荡不安，OpenAI永远领先谷歌一步。每当谷歌想出一个“复仇杀手”，想要羞愧时，OpenAI总会抢风头。

例如，新推出的核弹级多模态大型模型GEMINI 15、只在科技话题榜单上“爆”了几个小时，没人关心，因为SORA发射后立即爆火，更抢眼。

毫无疑问，人工智能领域正在上演世界上最激动人心的《速度与激情》，领先的OpenAI漂亮地获胜，其次谷歌也输得不错。我发现，他们的处境被龙年春节档的热门电影准确把握。

如果说OpenAI是惊艳刺激的“火辣辣”，那么谷歌就像是《飞天人生2》中的中年赛车手，奋力追逐梦想，鼓起勇气全力以赴，结果不是胜利，而是大翻车。

谁将获得AGI赛道终点的圣杯的结果仍然未知，但一年多来，仅仅享受这场长距离比赛的初始阶段就非常令人兴奋。

谷歌和OpenAI的AI对决，可谓是屡屡失败，屡屡失败。让我们从这场精彩的“双英雄竞赛”中，来看看北美AI巨头的整体产业竞争情况。

谷歌三连败，北美AI巨头热情结盟

目前，北美有三家AI巨头在争夺AGI通用人工智能的圣杯：OpenAI、谷歌和Meta。

其中，Meta 走的是开源路线，其大模型系列 LLAMA 是目前全球最活跃的 AI 开源社区。 OpenAI和谷歌在同一条轨道上，主要是构建“闭源”大模型。

虽然OpenAI被嘲笑为“不再开放”，但谷歌员工也大胆告诫“我们和OpenAI没有护城河”。但从另一个角度来看，为了说服用户付费，闭源业务策略必须提供高质量的模型和不可替代的能力，这也将带动模型制造商不断创新，保持竞争优势，这是AI行业不可或缺的业务力量。

因此，北美AI三巨头的对抗格局是Meta卷生态、OpenAI和谷歌卷模型。

那么，当您专注于模型赛道时，比赛呢？

整个2023年，与OpenAI同轨的谷歌，都深尝到了同侪压力的滋味。

本次比赛可分为三个阶段：

round1.chatgpt vs bard.

毋庸置疑，这是谷歌通过OpenAI的“摘桃子”掀起的一场竞赛，从此只能跟着OpenAI一路走下去。

2022 年 11 月，OpenAI 发布 ChatGPT 并一炮而红，掀起了全球大型语言模型的热潮。

其中，ChatGPT的基础技术Transformer是由谷歌推出的，大型语言模型的出现是由谷歌研究员Jason Wei（后来转投OpenAI）发现的。利用谷歌的技术抢夺谷歌的人，冲击谷歌的AI领导地位，OpenAI可谓是“面子输出”。

谷歌的回应是“愤怒和愤怒”。

2023 年 3 月，Google 紧急发布了 Bard。但这款机型本身的性能比较弱，上线时功能有限，只支持英文，只针对少数用户，用ChatGPT根本玩不了。

round2.gpt-4 vs palm2.

有人说谷歌采用了“天极赛马”的策略，在首款游戏中就特意发布了一个相对较弱的机器学习模型吟游诗人。这有一定的道理，但每匹受不了OpenAI的马都是一匹好马。

OpenAI 很快推出了 GPT-4 的升级版，并开放了 GPT-4 API，让谷歌走得更远。

5 月的 Google IO 2023 发布会，被派出去玩 GPT-4，也是一个“过渡产品”。谷歌研究副总裁Zoubin Ghahramani表示，Palm 2 是对早期模型的改进，它只是缩小了谷歌和 OpenAI 在 AI 上的差距，但整体上并没有超越 GPT-4。

这一轮，谷歌仍然落后。谷歌显然意识到了这一点，同时在本次发布会上宣布，正在培养一位Palm的继任者，名叫Gemini，他押注着数亿的净资产，准备在年底上演一场“王子复仇”。

round3.双子座家族 vs SORA + GPT-5。

2023年12月底，谷歌Gemini“姗姗来迟”，谷歌最强大、最通用的AI模型，被称为“复仇杀手”。在此期间，OpenAI上演了一场“甄嬛回宫”的宫斗戏，并没有特别爆款。谷歌这次能拿回属于它的一切吗？

遗憾的是，谷歌一直没能在AI领域上演“龙王归来”。

Gemini 的三种尺寸：Nano、Pro 和 Ultra，其中 Gemini Pro 在常识推理任务上落后于 OpenAI 的 GPT 模型，Gemini Ultra 仅比 OpenAI 一年前的产品 GPT-4 领先几个百分点。而且，Gemini也被曝光，自称打败了GPT-4的多模态**，有后期制作和剪辑组件，用中国模特生成的中文语料库进行训练，自称是文心一言。

谷歌在 Gemini Ultra 发布几天后推出了多模态大型模型 Gemini 15. 可稳定处理多达100万个token，创下最长上下文窗口记录。

这是一个令人兴奋的结果，没有Sora。

几个小时后，OpenAI推出文字**代模型SORA以前所未有的**代性能，以及世界模型的产品化，再次惊艳世界，抢走了双子座1号5个主题，也加强了他们的AI领导地位。目前，人们倾向于认为OpenAI仍然领先于谷歌。

此前，大家纷纷猜测GPT-5已经差不多被训练好了，面对的是谷歌目前最强的模型Gemini 15、已经有人在空中喊奥特曼，问他要盖宝宝多久，要不赶紧放GPT-5。

至此，持续了一年左右的北美AI“天极赛马”，以谷歌的三连败而落下帷幕。

agi 的不同路径，难以飞翔的谷歌

AGI是一场漫长的比赛。拉长轴来看，谷歌和OpenAI一年的对峙，暂时的成败，未来可能不多。有资格进入顶级赛道，这本身就是谷歌人工智能实力的证明。

比起输赢的结果，更值得讨论的是，谷歌已经成为了一整年的“销量之王”，为什么一直被openai甩在后面，跟不上呢？

田记赛马，输一次就是战术失误，每次输，或许可以从马种、马圈、草料等来源上注意是否已经存在问题。

言归正传，谷歌和OpenAI可以说是有着相同的目的和不同的路径。

同心，双方均以实现通用人工智能为目标，摘下AGI的圣杯;

不同的是，双方选择的技术路线不同。 OpenAI 使用更通用的语言能力作为实现 AGI 的基础，因此它采用了对 NLP 领域至关重要的 Transformer 架构，创建了一系列 GPT 模型，这导致了 ChatGPT 的惊艳亮相。

谷歌的情况并非如此。多年来，谷歌旗下的人工智能研发机构DeepMind利用强化学习和深度学习来解决各种人工智能问题，积累了广泛的技术。例如，惊天动地的AlphaGo，彻底改变生物学的AlphaFold，以及Transformer等NLP技术。

这相当于两个车手准备比赛，OpenAI为AGI选择一个场地，比如“方程式赛车”，然后以语言为核心开发制造模型，对汽车（模型）的结构、长宽、发动机、气缸等进行优化（工程）。另一方面，谷歌的 Deepmind 不确定哪辆车会结束 AGI 比赛，并且有很多技术工具可供使用，因此它制造了方程式赛车、跑车和摩托车。

两条路线之间没有优缺点。 然而，随着大型语言模型的“智能涌现”，证明了OpenAI选择的技术路线更有希望实现AGI，而谷歌的Deepmind的技术路线暴露了明显的短板：

1.方向分散且成本高昂。 在各个技术方向投入的泛创新消耗了大量资金，Deepmind与谷歌母公司Alphabeta在商业化上的矛盾正在加深。在OpenAI大规模融资加速之际，谷歌正在通过裁员来节省成本，以增加对AI的投资。

2.有太多的选择需要集中注意力。 谷歌开创了许多技术，但每种技术的重要性和强度也是分散的，到处都是没有水的井。最典型的是 Transformer 架构，它是由 Google 发明的，但由 OpenAI 发扬光大。 ChatGPT的出现也是在研究人员在谷歌发现之后，但并没有被认真对待，在离开OpenAI后继续前进。

3.着陆很慢，结果太慢了。 谷歌在人工智能方面也是出了名的保守，导致结果的翻译效率低下，即使有先进的技术。一位前谷歌员工曾抱怨说，谷歌的项目一般都是吹嘘一段时间，然后什么都不发布，然后一年后项目就被砍掉了。这从SORA的爆发中可以看出，谷歌对于用于训练SORA的扩散模型和文生图模型有相应的技术储备和成果，但一直没能先做出像SORA这样的产品。

可以看出，由于一开始就押错了轨道，当大语言模型成为AGI最有潜力的实现路径时，OpenAI的领先趋势已经成为一种趋势。这个时候，谷歌要回到OpenAI所在的技术轨道上，当然会处于劣势。

走错一步，走错一步的“人生”，站起来就意味着一切

坦率地说，谷歌已经在积极解决问题，包括技术策略选择错误、内部管理效率、人员冗余、AI技术人才外流等。

去年 4 月，谷歌合并了其两个 AI “手柄”团队 Google Brain 和 DeepMind，共同开发 Gemini。就最终结果而言，双子座的表现非常出色，1第5版是目前世界上最先进的大型模型之一。内部资源也严重向人工智能领域倾斜，一些人工智能人才外流又回到了谷歌。

实际行动表明，谷歌在明确赛道后，追赶OpenAI的决心和速度都处于同一水平。

但持续落后的现实也充分说明了一点：自己的失败是可怕的，朋友的成功更令人担忧。

尽管谷歌已经尽力解决自身的短板，并竭尽全力推广大模型，但还是经不起OpenAI加速做强。

一方面，OpenAI的研发团队可以说是全力以赴，而谷歌新合并的团队仍然需要磨合。 SORA的核心研发人员比尔·皮布尔斯（Bill Peebles）曾透露，团队基本上天天不睡觉，一年来都在高强度工作。 Google Brain 和 Deepmind 合并后，很多员工不得不放弃自己熟悉的软件和原来的项目去开发 Gemini。

此外，相较于谷歌补救性人才招聘，OpenAI吸纳了全球顶尖AI人才的动能。 就在2月份，阿尔特曼在社交媒体上公开表示，“所有关键资源都已到位，并且非常专注于AGI”，他正在寻找人才。归根结底，AI的竞争是人才的竞争，因为AGI中最重要的是智力资源，而顶尖和最优秀的人才也只有那么多，这也让人为谷歌能否赶上OpenAI而汗流浃背。

在电影《飞翔人生2》中，主角再次尝试赛车并翻车后，并没有继续在赛场上追求胜利，而是作为一个热爱赛车运动的车手，踏上赛道只是为了证明自己。

谷歌与OpenAI的对决不能归因于简单的输赢。正如谷歌在《我们为什么关注人工智能（以及目的）》中所说：我们相信人工智能可以成为一项基础技术，它将彻底改变世界各地人们的生活——这就是我们的全部，这就是我们所热衷的！

所有勇于下场、站在赛道上的AI“赛车手”，都值得掌声。而这款充满速度和激情的 agi 游戏，一定会给观众中的我们带来更多的震撼。

OpenAI与谷歌，AI上线飞行生活

相似文章

谷歌趁着OpenAI的内讧，重组了AI团队，挖走了硅谷的华人高管张佳

谷歌利用OpenAI的内讧重组了其AI团队，并挖走了硅谷的中国高管比尔·贾（Bill Jia）

谷歌利用OpenAI的内讧重组了其AI团队，并挖走了硅谷的中国高管Bill Jia！。

Gemini，谷歌发布的最强AI模型

谷歌的新AI，“遥遥领先”？