算力租赁为何应运而生?
1)大型模型的兴起推动了对算力的需求。
算力是AI大模型训练的核心生产力,随着AI大模型的快速发展,对智能算力的需求呈现爆发式增长趋势。 根据IDC发布的《2023-2024年中国智能算力发展评估报告》,2022年中国智能算力规模将达到260eflops(每秒数百亿浮点运算),预计到2027年,中国智能算力规模有望超过1117eflops,中国智能算力规模的复合年增长率将高达339%。预计到2030年,人工智能驱动的全球算力将增长500倍,1000亿智能算力的蓝海市场已悄然开启。
大模型的爆炸式增长带来了算力需求的激增,其成功离不开万张训练卡的计算资源。 目前,流行的生成式大模型的训练主要依靠以A100 H100为代表的高性能GPU算力,既能提供高效的数据传输能力,又能尽可能降低闲置算力。
在全球范围内,GPT等一系列生成模型带动了行业对算力的需求大幅增加,但短期内,高端GPU的产能和交付效率有限,导致GPU供需失衡。
2)在国内,国产GPU与海外先进GPU仍存在一定的性能差距,制造工艺的缺陷使得短期内无法大量生产,因此目前国内AI产业的发展仍需主要依靠以NVIDIA和AMD为代表的海外先进GPU。
由于技术上的代际差距和生态习惯的使用,近年来,中国的人工智能计算芯片市场仍以英伟达为主。 IDC数据显示,2022年中国AI加速卡出货量约为109万张,英伟达以85%的市场份额保持着较高的竞争优势。 然而,在对抗和技术禁运的背景下,包括英伟达A800 H800在内的多款高端芯片已被禁入国内,中国AI大模算力面临缺卡困难,短期内挑战严峻。
2023 年 10 月,美国商务部工业和安全局 (BIS) 发布了一系列出口管制规则,更新了对包括中国在内的禁运国家先进计算集成电路、半导体制造设备以及支持超级计算应用和最终用途的物品的出口管制,并将 13 家中国实体列入实体清单。
在美国对中国高科技产业日益严格的限制威胁下,国内市场算力缺口进一步扩大,存量依赖和租赁需求激增。
英伟达显卡进口限制:受技术禁运影响,英伟达高性能GPU进口严格限制,国内市场趋紧。
利用现有资源:为了应对现有资源的短缺,国内企业纷纷转向利用现有存量资源,包括优化现有设备的配置,提高设备利用率。
爆发式租赁需求:在成本压力和市场需求的推动下,“买转租”的趋势越来越明显,GPU算力租赁需求迎来爆发式增长。
如何了解算力租赁行业。
算力租赁是以租赁的形式向用户提供算力或云计算资源,在这个过程中,用户可以根据自己的需要选择资源的使用类型和时间,不需要承担运维、升级等工作和相应的费用。 算力租赁一方面降低了下游客户灵活使用算力的门槛,更有利于众多AI创业公司快速开发和应用产品和服务,另一方面也充分利用闲置的计算资源,提高计算资源的利用效率。
AI算力租赁的业务本质是,拥有大型模型训练的软件研发商需要从拥有GPU资源的厂商那里租赁GPU算力。 出租人的利润**主要是租金收入减去营业成本,主要包括固定资产折旧、数据中心日常运营、IDC机房租金、人员成本等。
算力租赁有三种商业模式:
在AI算力租赁市场中,根据租赁双方的需求和资源,租金的衡量方式不同。 目前市场上常用的三种租金计量方法如下(三种计量方法可以相互转换)。
每台服务器租赁:按服务器(含8个GPU)计算,按月收取租金,适合需要长期稳定使用大量GPU资源的客户。 以较低的服务器运维成本提供最新的 NVIDIA GPU。
按算力规模租赁:按每年p计租,可根据算力需求选择合适的算力规模,实现更灵活的资源配置。
每GPU租赁:按GPU每小时计算租金,适合短期或临时算力需求,可根据实际需求随时调整卡数。
算力租赁市场的潜在发展方向:运营服务与解决方案。
目前,国内多家企业已实现在算力租赁领域的布局,相当一部分企业已做好未来更大规模扩张的规划。 我们认为,算力租赁在短期内可以更好地应对目前我国计算资源稀缺的问题,但从长远来看,如果想避免资源过剩、服务同质化带来的激烈市场竞争,算力租赁行业的相关从业者可能需要更多地关注以算力调度为代表的运营服务。 以及AI运营工具和整体解决方案。英伟达、甲骨文等海外企业纷纷推出基于算力租赁的整体AI服务工具和解决方案,或将为我国相关产业的发展提供更好的指导。
这是报告的节选,是报告的原始PDF
信息技术 - 算力系列二:算力租赁产业框架 - 中泰 ** [苏毅] - 20240123 [第 23 页]。
报告**:价值目录