公司何时才能赶上 OpenAI? 这个问题,想必是一年多来萦绕在很多读者心中的迷茫。
如果世界上只有一家公司能赶上OpenAI,谷歌应该是最有前途的玩家。
同为北美AI巨头的谷歌,拥有与OpenAI相同的AGI目标、世界一流的技术人才、全球财力,甚至OpenAI大模型的核心Transformer架构,都是谷歌原创的。
然而,从2023年到现在,AI领域一直动荡不安,OpenAI永远领先谷歌一步。 每当谷歌想出一个“复仇杀手”,想要羞愧时,OpenAI总会抢风头。
例如,新推出的核弹级多模态大型模型GEMINI 15、只在科技话题榜单上“爆”了几个小时,没人关心,因为SORA发射后立即爆火,更抢眼。
毫无疑问,人工智能领域正在上演世界上最激动人心的《速度与激情》,领先的OpenAI漂亮地获胜,其次谷歌也输得不错。 我发现,他们的处境被龙年春节档的热门电影准确把握。
如果说OpenAI是惊艳刺激的“火辣辣”,那么谷歌就像是《飞天人生2》中的中年赛车手,奋力追逐梦想,鼓起勇气全力以赴,结果不是胜利,而是大翻车。
谁将获得AGI赛道终点的圣杯的结果仍然未知,但一年多来,仅仅享受这场长距离比赛的初始阶段就非常令人兴奋。
谷歌和OpenAI的AI对决,可谓是屡屡失败,屡屡失败。 让我们从这场精彩的“双英雄竞赛”中,来看看北美AI巨头的整体产业竞争情况。
谷歌三连败,北美AI巨头热情结盟
目前,北美有三家AI巨头在争夺AGI通用人工智能的圣杯:OpenAI、谷歌和Meta。
其中,Meta 走的是开源路线,其大模型系列 LLAMA 是目前全球最活跃的 AI 开源社区。 OpenAI和谷歌在同一条轨道上,主要是构建“闭源”大模型。
虽然OpenAI被嘲笑为“不再开放”,但谷歌员工也大胆告诫“我们和OpenAI没有护城河”。 但从另一个角度来看,为了说服用户付费,闭源业务策略必须提供高质量的模型和不可替代的能力,这也将带动模型制造商不断创新,保持竞争优势,这是AI行业不可或缺的业务力量。
因此,北美AI三巨头的对抗格局是Meta卷生态、OpenAI和谷歌卷模型。
那么,当您专注于模型赛道时,比赛呢?
整个2023年,与OpenAI同轨的谷歌,都深尝到了同侪压力的滋味。
本次比赛可分为三个阶段:
round1.chatgpt vs bard.
毋庸置疑,这是谷歌通过OpenAI的“摘桃子”掀起的一场竞赛,从此只能跟着OpenAI一路走下去。
2022 年 11 月,OpenAI 发布 ChatGPT 并一炮而红,掀起了全球大型语言模型的热潮。
其中,ChatGPT的基础技术Transformer是由谷歌推出的,大型语言模型的出现是由谷歌研究员Jason Wei(后来转投OpenAI)发现的。 利用谷歌的技术抢夺谷歌的人,冲击谷歌的AI领导地位,OpenAI可谓是“面子输出”。
谷歌的回应是“愤怒和愤怒”。
2023 年 3 月,Google 紧急发布了 Bard。 但这款机型本身的性能比较弱,上线时功能有限,只支持英文,只针对少数用户,用ChatGPT根本玩不了。
round2.gpt-4 vs palm2.
有人说谷歌采用了“天极赛马”的策略,在首款游戏中就特意发布了一个相对较弱的机器学习模型吟游诗人。 这有一定的道理,但每匹受不了OpenAI的马都是一匹好马。
OpenAI 很快推出了 GPT-4 的升级版,并开放了 GPT-4 API,让谷歌走得更远。
5 月的 Google IO 2023 发布会,被派出去玩 GPT-4,也是一个“过渡产品”。 谷歌研究副总裁Zoubin Ghahramani表示,Palm 2 是对早期模型的改进,它只是缩小了谷歌和 OpenAI 在 AI 上的差距,但整体上并没有超越 GPT-4。
这一轮,谷歌仍然落后。 谷歌显然意识到了这一点,同时在本次发布会上宣布,正在培养一位Palm的继任者,名叫Gemini,他押注着数亿的净资产,准备在年底上演一场“王子复仇”。
round3.双子座家族 vs SORA + GPT-5。
2023年12月底,谷歌Gemini“姗姗来迟”,谷歌最强大、最通用的AI模型,被称为“复仇杀手”。 在此期间,OpenAI上演了一场“甄嬛回宫”的宫斗戏,并没有特别爆款。 谷歌这次能拿回属于它的一切吗?
遗憾的是,谷歌一直没能在AI领域上演“龙王归来”。
Gemini 的三种尺寸:Nano、Pro 和 Ultra,其中 Gemini Pro 在常识推理任务上落后于 OpenAI 的 GPT 模型,Gemini Ultra 仅比 OpenAI 一年前的产品 GPT-4 领先几个百分点。 而且,Gemini也被曝光,自称打败了GPT-4的多模态**,有后期制作和剪辑组件,用中国模特生成的中文语料库进行训练,自称是文心一言。
谷歌在 Gemini Ultra 发布几天后推出了多模态大型模型 Gemini 15. 可稳定处理多达100万个token,创下最长上下文窗口记录。
这是一个令人兴奋的结果,没有Sora。
几个小时后,OpenAI推出文字**代模型SORA以前所未有的**代性能,以及世界模型的产品化,再次惊艳世界,抢走了双子座1号5个主题,也加强了他们的AI领导地位。 目前,人们倾向于认为OpenAI仍然领先于谷歌。
此前,大家纷纷猜测GPT-5已经差不多被训练好了,面对的是谷歌目前最强的模型Gemini 15、已经有人在空中喊奥特曼,问他要盖宝宝多久,要不赶紧放GPT-5。
至此,持续了一年左右的北美AI“天极赛马”,以谷歌的三连败而落下帷幕。
agi 的不同路径,难以飞翔的谷歌
AGI是一场漫长的比赛。 拉长轴来看,谷歌和OpenAI一年的对峙,暂时的成败,未来可能不多。 有资格进入顶级赛道,这本身就是谷歌人工智能实力的证明。
比起输赢的结果,更值得讨论的是,谷歌已经成为了一整年的“销量之王”,为什么一直被openai甩在后面,跟不上呢?
田记赛马,输一次就是战术失误,每次输,或许可以从马种、马圈、草料等来源上注意是否已经存在问题。
言归正传,谷歌和OpenAI可以说是有着相同的目的和不同的路径。
同心,双方均以实现通用人工智能为目标,摘下AGI的圣杯;
不同的是,双方选择的技术路线不同。 OpenAI 使用更通用的语言能力作为实现 AGI 的基础,因此它采用了对 NLP 领域至关重要的 Transformer 架构,创建了一系列 GPT 模型,这导致了 ChatGPT 的惊艳亮相。
谷歌的情况并非如此。 多年来,谷歌旗下的人工智能研发机构DeepMind利用强化学习和深度学习来解决各种人工智能问题,积累了广泛的技术。 例如,惊天动地的AlphaGo,彻底改变生物学的AlphaFold,以及Transformer等NLP技术。
这相当于两个车手准备比赛,OpenAI为AGI选择一个场地,比如“方程式赛车”,然后以语言为核心开发制造模型,对汽车(模型)的结构、长宽、发动机、气缸等进行优化(工程)。 另一方面,谷歌的 Deepmind 不确定哪辆车会结束 AGI 比赛,并且有很多技术工具可供使用,因此它制造了方程式赛车、跑车和摩托车。
两条路线之间没有优缺点。 然而,随着大型语言模型的“智能涌现”,证明了OpenAI选择的技术路线更有希望实现AGI,而谷歌的Deepmind的技术路线暴露了明显的短板:
1.方向分散且成本高昂。 在各个技术方向投入的泛创新消耗了大量资金,Deepmind与谷歌母公司Alphabeta在商业化上的矛盾正在加深。 在OpenAI大规模融资加速之际,谷歌正在通过裁员来节省成本,以增加对AI的投资。
2.有太多的选择需要集中注意力。 谷歌开创了许多技术,但每种技术的重要性和强度也是分散的,到处都是没有水的井。 最典型的是 Transformer 架构,它是由 Google 发明的,但由 OpenAI 发扬光大。 ChatGPT的出现也是在研究人员在谷歌发现之后,但并没有被认真对待,在离开OpenAI后继续前进。
3.着陆很慢,结果太慢了。 谷歌在人工智能方面也是出了名的保守,导致结果的翻译效率低下,即使有先进的技术。 一位前谷歌员工曾抱怨说,谷歌的项目一般都是吹嘘一段时间,然后什么都不发布,然后一年后项目就被砍掉了。 这从SORA的爆发中可以看出,谷歌对于用于训练SORA的扩散模型和文生图模型有相应的技术储备和成果,但一直没能先做出像SORA这样的产品。
可以看出,由于一开始就押错了轨道,当大语言模型成为AGI最有潜力的实现路径时,OpenAI的领先趋势已经成为一种趋势。 这个时候,谷歌要回到OpenAI所在的技术轨道上,当然会处于劣势。
走错一步,走错一步的“人生”,站起来就意味着一切
坦率地说,谷歌已经在积极解决问题,包括技术策略选择错误、内部管理效率、人员冗余、AI技术人才外流等。
去年 4 月,谷歌合并了其两个 AI “手柄”团队 Google Brain 和 DeepMind,共同开发 Gemini。 就最终结果而言,双子座的表现非常出色,1第5版是目前世界上最先进的大型模型之一。 内部资源也严重向人工智能领域倾斜,一些人工智能人才外流又回到了谷歌。
实际行动表明,谷歌在明确赛道后,追赶OpenAI的决心和速度都处于同一水平。
但持续落后的现实也充分说明了一点:自己的失败是可怕的,朋友的成功更令人担忧。
尽管谷歌已经尽力解决自身的短板,并竭尽全力推广大模型,但还是经不起OpenAI加速做强。
一方面,OpenAI的研发团队可以说是全力以赴,而谷歌新合并的团队仍然需要磨合。 SORA的核心研发人员比尔·皮布尔斯(Bill Peebles)曾透露,团队基本上天天不睡觉,一年来都在高强度工作。 Google Brain 和 Deepmind 合并后,很多员工不得不放弃自己熟悉的软件和原来的项目去开发 Gemini。
此外,相较于谷歌补救性人才招聘,OpenAI吸纳了全球顶尖AI人才的动能。 就在2月份,阿尔特曼在社交媒体上公开表示,“所有关键资源都已到位,并且非常专注于AGI”,他正在寻找人才。 归根结底,AI的竞争是人才的竞争,因为AGI中最重要的是智力资源,而顶尖和最优秀的人才也只有那么多,这也让人为谷歌能否赶上OpenAI而汗流浃背。
在电影《飞翔人生2》中,主角再次尝试赛车并翻车后,并没有继续在赛场上追求胜利,而是作为一个热爱赛车运动的车手,踏上赛道只是为了证明自己。
谷歌与OpenAI的对决不能归因于简单的输赢。 正如谷歌在《我们为什么关注人工智能(以及目的)》中所说:我们相信人工智能可以成为一项基础技术,它将彻底改变世界各地人们的生活——这就是我们的全部,这就是我们所热衷的!
所有勇于下场、站在赛道上的AI“赛车手”,都值得掌声。 而这款充满速度和激情的 agi 游戏,一定会给观众中的我们带来更多的震撼。