在国内大型模型行业已经完成卷起模型量、应用量生态、相互争斗、相互竞争的时候,基础模型终于迎来了突破,继昨日发布克劳德3之后
当然,总的来说,Claude 3 有很多令人惊讶的地方,例如极快的响应时间、强大的视觉功能、200k 的上下文长度以及各种数据集和更高的任务准确性但与 Gemini 刚发布时的宣传视频(不是 Gemini 手动狗头)不同,它不仅带给人们“超越 GPT-4”,而且“超越 GPT-4 范式”,GLUDE 3 更像是 GPT-4 已经为大模型规划的发展路径上的修补突破
而有意思的一点是,尽管克劳德系列实际上从开播以来就一直保持着不错的表现,但在各大评测榜上也是第二、第三,甚至这一次的克劳德3“翻农奴唱”,一举超越了BOSSGPT-4,不过,大家讨论中最热门的话题依旧是OpenAI
只要你在搜索与 Claude 3 相关的内容和查询,几乎每个 Claude 3 都必须带上 OpenAI 或 GPT-4当然,这也是因为克劳德3最大的卖点是“打败GPT-4”,但对于一家公司在市场上的热度来说,同理心是OpenAI是否发布GPT-45 或 GPT-5,标题可能永远不会有克劳德。
不光是**的片名,当社区里的大家看到克劳德3这样的表演,甚至第一反应都是“我更期待GPT-5”?
而网友的这种期待似乎也不是空想的,更何况三个月前就有关于GPT-4的传闻5 嫌疑人** (GPT-4.)5.可疑**! 三款车型,多模态能力大幅升级,定价被泄露),上个月刚刚在谷歌的 Gemini 1 上说在5 Pro发布的同一天,OpenAI发布了Sora,它立即抓住了热度,占领了流量高地Gemini 15 Pro已经有一整天没有出现在头条新闻上了,信息马上都是关于Sora的。
而这种情况,不久前被张俊林总结为“压制链理论”。具体来说,在整个大模型领域,OpenAI已经成为当之无愧的“行业领跑者”,处于链条的顶端,而占据先发优势的OpenAI,“有能力压制有潜力追赶的竞争对手”,比如谷歌和Anthropic
在这个压制链中,该理论设想了一个位于链顶端的老板OpenAI,以及链条底部的一群追随者。 由于其先发优势,OpenAI有能力构建“技术储备”,存储许多“秘密”的优秀模型。 为了打压竞争对手,保持其“优势地位”,OpenAI不会选择直接发布自己开发的新机型来抢占市场先机,而是会等待竞争对手发布机型,根据其机型的先进程度,在其“技术池”中选择机型来“打压”竞争对手。
由于大模型市场产品的高度“同质化”(其实这也是这个压制链能够发挥的核心原因),OpenAI在实施压制策略时,往往会让竞争对手过去投入的高额研发成本无法转化为有效的市场份额, 并成为沉没成本,从而达到OpenAI为市场追随者“制造竞争压力”甚至“迫使他们退出市场”的手段
这种策略在OpenAI推出ChatGPT打压克劳德的时候就能看到,今年SORA打压Gemini的时候我们也能看到,社区里的大家甚至都期待看到GPT-5打压克劳德3的那一刻。 然而,24小时过去了,GPT-5的王者炸弹还没有出现,这个“GPT-5在哪里”的表情包也迎来了进化:
事实上,虽然OpenAI在压制链理论下看似是个不错的“狙击手”,但这次似乎是克劳德3的“反击”。
正如我们报道的那样,在过去的两天里,OpenAI陷入了被埃隆·马斯克(Elon Musk)起诉的“泥潭”,指责其不是开源的(马斯克正式起诉了OpenAI和奥特曼! )。
而据网友分析,事实上,克劳德 3 似乎是刻意选择在 OpenAI 可能无法快速实现“压制”的时候快速上线的,让 OpenAI 措手不及
也许 Anthropic 的 CEO Matt Schumer 或者是大模型社区的任何成员,可能每个人都知道 OpenAI 内部一定有更高级的大模型,而 GPT-5 只是时间问题。 而这个时候,马斯克的起诉,无论能不能成功,都可能为Anthropic这样的“后来者”争取宝贵的时间。
那么,在OpenAI的压制链下,后来者真的一点机会都没有吗?
在管理科学顶级期刊上i don’t “recall”: the decision to delay innovation launch to **oid costly product failure哈佛商学院的团队设置了一个场景,在这个场景中,每家公司都急于在竞争激烈的市场中将创新产品推向市场。 然而,快速发布创新产品的缺点可能是这些产品没有经过严格的测试(例如,大型模型的安全风险审查和对齐),而没有经过严格测试的产品将在未来面临“召回”的风险。
在此背景下,本文通过动态博弈模型发现,即使产品快速上市时“召回”风险较高,但当竞争对手被期望提前推出创新产品时,最好的做法可能仍然是快速发布以抓住机会。 因为这种模式更有可能让竞争对手在“召回”的情况下破产,从而获得“赢家通吃”的可能性。
而在压制链的背景下,虽然 Anthropic 推出的 Claude 3 可能会被 OpenAI “压制”,但 Claude 3 的推出反过来又迫使 OpenAI 使用 GPT-45 或 GPT-5 的快速推出迫使 OpenAI 承担了与他们的“明星产品”(类似于谷歌的 Bard 首次亮相演示翻转)无法很好地工作的巨大潜在风险。
而且,也正是因为OpenAI的“口碑”,OpenAI翻车造成的“召回”成本将远远大于Anthropic可能承担的“召回”成本,而此时,大家对OpenAI GPT-5的期待,反过来又会成为OpenAI真正的双刃剑。
而如果我们把目光转向OpenAI的压制链本身,这个逻辑生效的根本原因,也是市场产品的高度“同质化”。
每个家族的大模型,无论是OpenAI的ChatGPT、Anthropic的Claude,还是谷歌的Gemini,目前都没有表现出明显的“不可替代性”,甚至在国内大模型“百模大战”中,模型所能提供的大部分功能都在赶超GPT的路上,这个时候,更高级的类GPT模型将不可避免地压制剩下的100或1000个模型。
但是,如果各种大型模型寻求差异化竞争,例如垂直领域模型和小终端模型,OpenAI的打压不一定会生效
事实上虽然OpenAI依然牢牢占据着“先发优势”,但这个“行业领跑者”的地位并非牢不可破,虽然OpenAI拥有“压制链顶端”的身份,但这种压制策略不可能总是有效的
对于市场龙头来说,除了“先发优势”之外,还有“后发优势”,就像国内很多大型样板企业都做过的那样,在通过试错走向openAI成功的道路上,后发企业付出的“试错成本”将大大降低。
而就像马斯克起诉OpenAI一样,成熟的老板往往会面临更多意想不到的甚至潜在的威胁,而这些“机会”也让追赶OpenAI成为可能。
好吧,事实上,在克劳德 3 的发布之外,我们或许能够发现,在 OpenAI 在**和社区的赞誉和期待下,克劳德 3 背后的“全球最强模型易手”,可能可不是几个数据集的百分百涨那么简单!