这两项融资超过了去年中国大型样板场的融资总额。文丨王和佟编辑丨程曼琪
进入2024年仅一个多月,中国大型模型领域的资本竞争进入了一个新阶段。
《晚点邮报》获悉,大型模型创业公司Moonshot AI近日完成逾10亿美元的B轮融资,投资方包括阿里巴巴、美团、小红书和红杉中国。 在本轮融资结束时,《月球的黑暗面》的估值超过23亿美元。
这是目前中国大型模型空间最大的单轮融资,但这个纪录不一定能持续太久。
据了解,另一家大型样板头公司也在进行10亿美元的新融资,交易已进入后期阶段。
这两项10亿美元的融资总额已超过去年中国大型示范行业的公共融资总额(约100亿元人民币)。
大型模型创业公司正在争夺仅剩的一点氧气:美元投资整体低迷,人民币**更注重确定性,而大模型重投资的意愿和实力主要是大型互联网或科技公司。
作为有限投资者,中国各大互联网公司也陷入了激烈的竞争,并分化为不同的行动和策略:一是大量外资服务于战略目标; 二是暂时不出手,专心做自己的大模型。
月亮的暗面,这一轮的新股东阿里和美团,都属于第一派系。
阿里巴巴此前曾投资过大型模型创业公司智普AI、百川智能、零一万物; 美团则投资了智普AI,并投资并收购了光年远。
其他广撒网的公司包括腾讯和小米:腾讯去年投资了百川智能、智普AI和MiniMax; 雷军创立的顺为先后投资了百川智能、智普AI和MiniMax,其中百川和智普AI也被小米投资。
而字节还没有投资大型模型公司。
阿里巴巴是中国最积极投资大型模式的互联网公司之一。
一位投资人表示,在阿里巴巴和腾讯同时投资的百川和智普AI中,阿里的持股比例更高。 这一次,阿里巴巴参与了月球黑暗面的新一轮融资,金额超过10亿美元。
行动的差异来自于不同的战略意图和坚定性。
2023年,阿里巴巴形成了一个相对明确的大规模模型战略:最大的目标不是靠自研模型赚钱,而是为众多大模型提供云计算能力,抢占机遇,成为AI计算基础设施。
硅谷风险投资公司A16z的一项调查发现,大型模型和生成式AI初创公司的早期融资中,有80%-90%用于从云计算平台购买算力; A16Z估计,当行业更加成熟时,模型和应用公司也会将其年收入的10%-20%发送给云计算公司。 相当于“人工智能税”。
征收AI税的方法之一是与潜在的大型模型公司,即AI算力买家深度合作:例如,Microsoft去年年初承诺向OpenAI投资100亿美元,其中大部分是以云计算资源而不是现金结算; 谷歌和亚马逊去年还承诺对Anthropic进行总计60亿美元的投资,Anthropic将在四年内在谷歌的云计算服务以及亚马逊的云计算服务上花费超过30亿美元。
大力投资大型机型将帮助阿里云继续巩固其作为中国第一市场的地位,并抓住人工智能计算带来的增量增长。
与阿里巴巴相比,腾讯的投资较弱,这可能是由于两个原因:一是云计算业务对腾讯的重要性不如阿里巴巴重要,CSIG(腾讯云与智慧产业事业群)近两年一直在精简人员; 其次,腾讯希望更多地关注自己的混合模式。
那些还没有投资过大型模型创业公司的人有自己的逻辑。
根据2023年Q3财报,期末现金及现金等价物不足350亿元,而同期字节现金储备超过300亿美元。
在资源有限的情况下,当务之急是做好自己的大模型和相应的产品。 一位接近他的人士表示,去年,很明显不投资大型样板企业,而是专注于应用公司。
拥有大量可投资资金的字节跳动曾多次动摇。
据《晚点邮报》报道,字节曾在2023年上半年考虑投资大型模型公司Minimax和StepLeap Star,但最终没有出手。
2023年年中,Byte决定不投资大型模型公司,而是专注于打造自己的大型模型,这是Byte在AI时代抓住超级应用机遇的关键。
而就在最近,Byte再次联系了领先的大型模型公司,重新评估投资的必要性。
背景是字节自身开发大模型的进展没有达到预期; 阿里巴巴的咄咄逼人的举动,以及近期大规模投融资竞争的暗流,也带来了一些压力。
OpenAI 的生成模型 SORA 上周刚刚发布,是一个新的冲击。
此前,市场有一种观点认为,拥有抖音和TikTok的字节,以及拥有YouTube的谷歌,拥有大量数据,具有制作多模态模型的优势。
SORA的强势表现表明,一个足够强大的大型语言基础模型可以覆盖**等其他模态能力,模型的技术能力可能比数据资源更重要。
大型互联网技术公司最初可以访问现成的内容或社交产品,然后获得大量数据,他们不得不重新评估他们是否能够保持领先地位。 “Bytes现在可能有点恐慌,他们以前手里没有任何投资卡。 一位修炼者说。
由阿里巴巴和美团投资的“月亮的暗面”成立于2023年3月,由清华大学交叉信息科学研究院助理教授杨志林创立。
现年32岁的他毕业于清华大学,获得计算机科学与技术学士学位,并在卡内基梅隆大学语言技术研究所(LTI)攻读博士学位。 在此期间,他是Transother-XL和XLNet的第一作者; 前者是第一个全面超越RNN的注意力语言模型,后者在20个任务上超越了Google BERT模型。 自2019年以来,杨志林本人的学术引用次数超过20,000次。
许多与杨志霖关系密切的投资人评价他:他难得聪明,增长速度惊人。 The Dark Side of the Moon 的特点是专注于中文、长文本和 C 产品驱动器。 2023年10月,月亮暗面发布的首款机型Moonshot和智能助手Kimi,可支持20万个汉字输入,即25x,OpenAI 的 GPT-4-32 K(约 2..)50,000字)。
一位AI从业者表示,在去年下半年的这个时间点,月亮暗面也是中国领先的大型样板企业之一,投资业绩相对较高:去年10月20亿元A轮融资后,估值约8亿美元, 低于当时估值近20亿美元的Minimax和智普AI,以及已经是独角兽的百川智能。
单轮 10 亿美元的融资通常不会发生在一个行业的早期。 哪怕是在融资热潮的最后一波AI热潮中,商汤科技总共用了4年时间筹集了10亿美元,旷视科技也花了7年左右的时间,而月球的阴暗面也只成立了11个月。
异常投资的背后,是投资者不平凡的机遇和高期望。 阿里巴巴、美团等公司对月球黑暗面的B轮投资,或许引爆早已像火花一样弥漫的FOMO(恐似错过)尘埃。
标题图片**:复仇者联盟4:终局之战