聪明的东西
作者 |李水清
编辑 |心
2024年,国内AI企业将遭遇“算力饥渴”。 从互联网巨头到生成式AI新秀,在首款大模型推出后,算力成为提升产品竞争力的核心资源。
尽管云巨头陆续推出吸睛的大型模型来训练和推动“全家桶”,但实际可用的算力仍然是稀缺资源。 百款车型之争空前激烈,快速迭代迫在眉睫,大型车型企业必须占据市场前列,格局才稳定下来。
就在过去的六个月里,百川智能、Minimax、申研科技这三家国内知名的大型模型创业公司,纷纷投入算力暴发户的怀抱。
这个算力新贵是英博数字,刚成立18个月,却满满标签。
是“彩票大王”鸿博股份的全资子公司,踩着英伟达GPU算力红利的顺风,承载着母公司转型的希望,带动鸿博股份股价2024年飙升580%,扫除连续六年下跌的阴霾;而因为与英伟达的合作关系,引发了各种遐想,引来了深交所几封关注函的“灵魂质疑”。
鸿博股份近一年市值变动情况(来源:**童)。
中标国内最大算力服务协议:10月,与北京京能签约,共建超大型智能算力中心,总金额近10亿元;12月,与大型模型公司百川智能签约近14亿元同月,它宣布与多模态大型模型公司minimax签订了大量算力订单近3亿元的合同。
神秘、跨界、炒作、妖股......长期以来,围绕英博数字的各种谣言已经聚集起来然而,随着大规模算力订单的公布,疑虑逐渐消散,取而代之的是对其商业模式的关注:
从默默无闻的人到算力的黑马,从摸石头过河到签约过亿元订单,一家没有计算背景的年轻公司,如何获得稀缺的英伟达计算资源?而你又为何要从云工厂“虎口抢食”,赢得国内头部模范创业公司的青睐?作为传统产业向算力租赁转型的典范之一,鸿博股份和英博数字科技代表了怎样的行业真相?
近日,智东独家对话宏博股份副总裁、英博数字CEO周薇薇,揭秘亿级大规模模型算力订单和算力租赁商业模式背后的思路。
InBev Digital 定制 GPU 服务器(来源:InBev Digital)。
过去一年,传统大厂做算力跨境的情况并不少见。
在国外,美国加密货币矿商CoreWe**E成为年度最炙手可热的“算力黑马”之一,依靠转型销售GPU云服务,凭借数万颗GPU芯片拿下数十亿美元的算力订单,年营收估计暴涨1567%。
在中国,受益于如火如荼的“百模大战”,一批算力概念股被热潮带走,股价连涨一年。 “彩票大王”鸿博股份、“味精大王”莲花健康、舷外机龙头恒润股份、游戏厂商世纪华通......他们都走上了买卡、建智能计算中心、租用GPU算力的道路。
弘博股份和莲花健康近一年股价变动情况(来源:腾讯自选股)。
2024年下半年,相关智能计算基础设施布局将爆发式布局。 千点级智能计算中心的建设计划,数亿至10亿元的GPU服务器采购和算力租赁订单比比皆是。 疯狂的GPU算力火焰一直燃烧到2024年初。 仅在1月3日、4日,金鸡股份与青云科技宣布了三笔租赁1亿AI算力的大订单,总金额超过12亿元。
计算股中,最引人注目的是互联网彩票龙头鸿博股份,其全资子公司英博数字科技已拿下多家大型模型公司算力订单。
百川智能、Minimax、申研科技等大型模型初创企业,鲁辰科技、五文新琼等明星大型模型中层技术服务商,以及中科朗科等细分垂直行业的龙头企业,都已经是英博数码的客户。
鸿博股份由尤玉贤、尤丽娟姐妹创立于2024年,2024年5月,随着彩票印刷业务在深圳证券交易所上市,成为“互联网彩票第一股”,上市首日第一价3。每股 35 美元。 2024年,宏博股份股价最高涨至3016元股份,也是在这一年,其主营业务受政策影响而遭受重创,此后开始频频探索跨界转型。
这家互联网彩票印刷领军企业的转型方向包括大数据、5G、RFID智能标签、手机游戏......自2024年以来,其印刷业务收入连年下滑,处于亏损状态。 截至2024年8月终止对广州智能扫地机器人研发业务语言机器人的跨境收购时,鸿博股份股价已跌至792 美元。
2024年鸿博股份股价变动情况(来源:腾讯自选股)。
当外界为其再转型失败而感叹时,鸿博股份马不停蹄地踏入算力赛道。
2024年4月,鸿博科技与英伟达签订采购协议,非常高兴地购买了20台A100 DGX;6月1日,鸿博投资1000万元成立英博数码两个月后,英博数字科技运营的北京AI创新赋能中心项目启动,鸿博股份正式进军AI算力租赁业务板块。
这一次,鸿博股份中了赌注。
这一前瞻性的选择,让鸿博开启了“算力黑马”模式的新版,半年后,它吃下了AIGC算力供需失衡的红利,股价暴涨,市值暴涨。
在过去的半年里,百川智能创始人兼CEO王小川一直在为算力奔波。
由搜狗前CEO王小川、搜狗前COO茹丽云创立的百川智能成立于2024年4月,从6月开始,几乎每个月都在高频迭代其模型,已进入国内大型模型初创企业第一梯队,对算力的需求可谓饥渴。
在8月召开的百川智能通信大会上,王小川透露,阿里云、腾讯云、火山引擎、浪潮、顺丰科技等150多家合作伙伴已经使用了百川模式,百川智能正在同时使用阿里巴巴和腾讯云服务。
王小川正在讲解百川两大车型的升级点。
10月,王小川作为大模型企业代表出席云天大会,透露阿里云支持百川智能完成千卡大模型的训练任务不久后,百川智能背书腾讯云,与腾讯云向量数据库合作,基于用户知识库构建智能问答演示系统。 随后,阿里巴巴、腾讯、小米等科技巨头均参与了百川智能的3亿美元A1融资。
在接受采访时,王小川曾表示,大模型行业训练和推理算力的总成本占大模型总成本的40%以上。 这说明了大模型创业公司普遍面临的资源压力:在第一轮资格赛之前,对大模型训练算力的渴求是无穷无尽的。
就在大家还在观望哪家云巨头能拿下更多大模型订单时,12月初,围绕百川智能的云服务协议公告,将业界的目光聚焦在了一家名不见经传的“小公司”英博数科身上。
根据鸿博12月5日公布的交易合同内容,英博数字将在2024年1月30日和4月30日前分两批交付协议约定的NVIDIA DGX HGX H系列智能计算服务器,共涉及13台82亿元。
合同公告截图。
同月,AI多模态大模型公司Minimax也与英博数字科技签订了GPU算力租赁合同,合同总金额近3亿元,包括多款GPU的租赁和使用。
展望未来,10月,英博数字与北京晶能签约近10亿元,北京晶能为主要投资方,双方共建超大型智能计算中心。
合同公告截图。
6月初,英博数字科技与大型模型创业公司申研科技签约,提供不低于1280p的算力。 至此,英博数字累计签约金额超过2亿元,5120P AI算力租赁服务协议订单签订已经完成。
来自国产大模“顶流”创业公司的背书,为英博数科的性能能力、库中和中途的GPU库存保障带来了真正的金牌认证,这也意味着英博数字已经站在了大模型算力创富运动的前沿。
为什么选择英博数字?很多人对此感到好奇。
英博数字成立于不到17个月前,拥有一支50多人的团队,并经历了几次失败的转型,似乎并没有一张特别明亮的王牌。
但这样一家小公司,在云服务和算力租赁的激烈竞争中,却接连接到了龙头大型模型创业公司的订单,独享了“天上财富”。
宏博股份副总裁、英博数字CEO周薇薇给出了一个很简单的答案:有算力。
2024年,英博数字科技于2月首次交付首台DGX A800算力集群,6月H800到货,8月完成由A&H系列智能计算服务器组成的1000P AI算力集群的部署和优化,10月共交付3000P AI算力,可为客户提供相当规模的GPU算力资源。
据艾瑞咨询统计,2024年大模型占中国智能算力总需求的58%8%是最大的需求方。
2024年,大机型将占据中国智能算力的最大需求。
当美国首纸限制停产英伟达高性能GPU芯片在华时,当这家云巨头可供训练的外部算力资源迫在眉睫时,拥有完整DGX交付能力的英博数字“化胎为正”,自然成为大型模型公司的首选。
毕竟,在算力业务中,拥有一张卡才是王道。
据周薇薇介绍,在中国,大型集群的稀缺性带来了溢价收入,128台机器集群的每台设备单价将高于同级别客户使用的32个集群的单租。
此前,鸿博股份在互动平台上披露,截至2024年9月,英博数字科技仅提供整台服务器的包月租赁方式,A系列服务器公布价格为16万元/月,H系列服务器正常价格为299万元平台。
英博数码的运维人员对机器进行调试(来源:英博数码)。
鸿博股份能够实现跨界转型,逆风力挽狂澜,这与与DGX合作的关键人物周薇薇是分不开的。
她拥有澳大利亚阿德莱德大学金融学学士学位、悉尼大学传播学硕士学位和国际政治经济关系博士学位,曾任亚视传媒执行董事、澳大利亚华人友好交流协会秘书长、36氪副总裁。
2024年刚回国时,她研究国内网点的互联网+,利用过去积累的财技信息,做早期项目的投后跟进,包括互联网彩票、游戏、DSP流量平台等,以及知名商用无人驾驶公司图森未来,这些项目基本在独立IPO或并购成功的5年内完成退出。
周 Weiwei,宏博股份副总裁,英博数码首席执行官。
2024年8月,图森未来宣布完成数千万美元B轮融资。 当英伟达出现在投资者中时,图森未来科技巨头们欣喜若狂。 正是从他们的口中,周维维清晰地感受到了技术从业者对英伟达的认可。
命运的齿轮开始转动。 大约三年前,在判断元宇宙将成为未来的生产生活方式后,周薇薇萌生了承接计算基础设施的想法。 她认为,当前流程与真正的元宇宙之间还存在一个通用人工智能(AGI),AGI将不可避免地掀起新一轮的基础设施浪潮。
在她看来,这种基础设施具有刚性需求强、粘性高、SKU少等特点,值得一做,而英伟达几乎是提供计算硬件的最佳选择。
自2024年底以来,周薇薇带领团队开展智能计算产业研究,集聚国内外多方力量、资源、团队,为算力储备而努力,目标是打造北京智能计算中心典范,进而在全国范围内推广复制。
截至2024年8月,鸿博股份等各方联合发起成立北京人工智能创新赋能中心,英博数字为唯一指定运营实体,推进算力租赁、云资源采购一站式服务、人工智能教育培训、产业实验室等主营业务。
此时,生成式AI方兴未艾,AI文生图的应用已经风靡一时,但“大模型”的概念还没有出圈。 英博数字成立三个月后,AI领域里程碑式产品ChatGPT惊艳亮相,掀起一股堪称整个科技行业代际更迭的创新浪潮。 周薇薇的重心也转移到了元宇宙的中间工具——AIGC(AI内容生成)。
2024年,AI行业将迎来新的点火。 大模型和AIGC的热潮,将英伟达推上了万亿美元市值的宝座,也给许多急需转型的传统企业带来了前所未有的机遇:大量的英伟达GPU设备采购协议让人铺天盖地,“AI算力”几乎成为提振股东积极性的永动机。
但困难接踵而至。 产品涨价、有竞争力的降价、设备禁售......一个接一个的困难开始摆在英博数字面前。
从发布之初,英博数字科技就一直摸着石头过河,走的是前方没有参照的路。
2024年2月,智能计算中心一期设备及配套软件全部到货,总算力100P的DGX标准单元SuperPod集群开始组网优化。 这时,周薇薇发现,唯一能租得起、用得起巨大DGX算力的客户,都是大型样板企业。
在英博数字的早期,周 Weiwei 和王小川讨论了人工智能的发展前景和基础设施建设的需求。 在王小川的建议下,英博数字科技在第一阶段就确立了“专业多模态大模型AI计算服务平台”的定位,并将核心任务锁定在一件事上——买货。
为响应大模型训练需求,智能计算中心一期DGX系列服务器由原规划的40G版本升级为80G版本。 趁着其他企业还在观望的时候,英博数字科技在2月份完成了算力设备的订单锁定,远远超出了原厂目前的业务需求,随后其首批设备赶上了美国对华芯片的限制,团队立即加快了计划,在6月30日前完成了未来14个月算力需求的订单储备。
基于这些先行者,当美国在10月份调整对华政策,导致许多高性能AI计算芯片**被封杀时,英博数字正面回应:美国对华芯片政策对系统中已经交付和存在的订单的交付没有影响。
英博数字团队日夜部署智能计算基地(来源:英博数字)。
货物的到来只是第一步,英博数字科技接下来的挑战是如何通过集群优化和软硬件协同调优,真正支撑大模型训练的高效运行。
周 Weiwei 记得,从第一个由 20 台 DGX 服务器(160 个 GPU)组成的 100P 算力集群开始,客户和英博数字技术共同构建和调试了超出原厂标准参数的训练效率,并使用高性价比的国产通信设备运行效果与昂贵的进口设备基本相同。
在4月成立之初,百川智能与英博数字科技签订了未来12个月NVIDIA GPU算力租赁服务的合同,是英博数字智能计算中心测试期间的合作伙伴和顾问,也是其智能计算中心5月正式运营后的首个签约付费客户, 英博数字技术开始产生收入。
在英博数字技术团队还处于组建阶段的阶段,百川智能的技术骨干为英博数字智能计算平台提供了一系列沟通建议,从短期服务定位到长期发展目标、集群优化、极限峰值压力测试、智能计算集群极端压力测试所采用的大模型等。
由此积累的集群优化与模型开发相结合的优化加速能力,也成为英博数字科技打造差异化竞争力、加速获客的优势。
自6月底以来,H800服务器已分批到货,并进行了第一轮单机对比测试。 英博数字团队公开了大型语言模型的实际测试数据,希望能帮助客户根据自身开发阶段做出更具性价比的参考。
英博数字在7月发布了大模型单机对比测试数据(来源:英博数字)。
但是,算力租赁赛道已经相当拥挤,没有高科技壁垒,美国对中国的限制也没有放松,依靠硬件设备储备的优势生存并不是长久之计。
英博数字开始提出新的定位:AGI全栈服务商。
当英博数字的第一套算力被支付时,周薇薇被问到一个尖锐的问题:“如果有一天,英博数字失去了设备原有的支持,甚至失去了硬件优势,未来该如何生存?”
她很清楚,鸿博股份来自传统企业,在技术研发上无法与互联网厂商竞争,所以英博数字科技要做“窄、小、深、深”的事情
狭隘,在细分领域并不罕见;小,这是一个可以让它运行的小团队;深,是行业第一条深的护城河;沈下沉够了,行业覆盖面够广,一定是未来5-10年有发展空间的朝阳产业。
以算力租赁服务为例,看似业务逻辑简单,如何便宜拿到货,如何找到客户,......这些**护城河实际上相当高。
然而,单一的算力租赁业务并不是一个长久的生存法则。 周 Weiwei 意识到,大模型和 AI 应用的生产必然会与几乎所有行业相连,随着高端算力需求的不断增长,这条赛道需要一个能够解决从基础设施到商业化的一站式服务平台。
因此,英博数字科技将其定位升级为:AGI全栈服务商,并希望形成中国版App Store(App Store)+Hugging Face(开源开发者和模型社区)。
英博数字将提供AGI全栈服务平台。
构建生态是周维维从英伟达学到的重要一课。 大型模型公司基本都是用Hugging Face和GitHub来研究和发现问题,周薇薇认为,把这些人聚集在一起,自然会形成一个交流社区,这是英博数字向全生态链过渡的中间阶段。
Bob Cloud,极品云中的极品,是英博数字研究公司开发的GPU云管理平台,旨在实现跨平台的GPU算力管理、协调、调度和集成,实现GPU算力和数据产品的共享。
在周薇薇看来,更多的人愿意加入你的平台,通过你的平台赚钱,这样才能形成良性循环,形成生态。
在波波云中,App Store 提供了多种基于多模态大模型的应用体验版本和专业版Tools Store 提供 ETL 自助式数据清洗工具和 PaaS 训练加速部署服务,来自五文核心穹顶、鲁辰科技等合作伙伴。
此外,还有为训练垂直场景模型提供数据产品的数据存储样板店可以方便客户进行基础和训练模型的自我开发和定制开发。
由于英博数字不提供简单的计算设备销售,智能计算中心在与合作伙伴共建、交付后采用英博数字的运维管理模式,因此所有参与英博数字的智能计算中心都将安装博博云管理系统。
除了算力大订单收入外,英博数字还计划从波波云各店铺产生的开发者共享、GPU云服务、梧桐计划、MM豆计划、产业聚合、开发者生态竞争、金融服务、AI通识教育推广、股权投资收益等拓展商业化体系。
这些是英博数码的生存方法和对策。 周薇薇估计,这些行业升级完成后,英博数字科技有望实现增值收入是现有合同数据的两倍。
回首2024年,在“百模大战”的狂潮中,算力成为躺着赚钱的生意,一批传统行业龙头成为热门“算力概念股”。 经历了一年的大浪淘沙,名气之下到底有谁难以辜负?谁是战斗中的真枪真剑?时间给出了一个阶段性的答案。
一些玩家已经被击败了。 比如,恒润股份因为喊话要规划1万便士算力,已经繁荣了半年多,但在2024年12月,其董事长因内幕交易被刑事拘留,导致股价“一夜之间回到解放前”,回落到2024年初的水平。
恒润股份近一年股价走势(来源:腾讯自选股)。
还有一些玩家还在路上。 比如CoreWe**e和英博数字科技在云计算巨头和芯片巨头的合作中发现了裂缝,成为AI时代卖铁锹给淘金者的人。
但算力服务会是一条经得起时间考验的转型之路吗?一方面市场竞争汹涌,另一方面进口芯片难以维持,相较于位于美国、靠近英伟达仓库、不受美国出口限制的corewe**e,日益紧张的算力库存导致部分**无法按时完成, 这一直是一个“紧绷的咒语”,困住了国内多家算力厂商。
2024年1月3日,青云科技公告原协议约定GPU服务器无法按时交付,其销售合同为69亿元减至14亿元;1月9日,金鸡实业发布公告称,美国限售令升级为原合同312亿元AI服务器交付产生影响,申万科技退还部分预付款。
轰轰烈烈的算力竞赛才刚刚开始。 进入2024年,AI算力缺口有望进一步加剧,但算力的“黑马”仍需解决诸多不稳定、不可控因素
即便是在大规模算力订单竞争中领先一步的英博数科,未来仍需克服诸多变化和挑战,在宣布AGI全栈服务商全新定位后,其业务版图的叙事更加宏大,也更难给出好的答案。