1月17日,WIM 2023(世界创新者大会)在北京举行尚明东,DataCanvas联合创始人受邀出席论坛并作题为“AI基础软件加速工业智能化升级”的主题演讲。 以下为尚明东先生的讲话实录:
2023年大模型的快速发展,点燃了全民对AI的想象,推动中国AI产业进入央企云建设、智能计算中心建设、大模型建设“三节车厢”带动的新发展阶段。 同年5月,国资委提出建设国有央企“1+N+M”云体系,即构建央企基础公有云、N产业公有云、M企业特色私有云,为算力云建设提供架构基础。
在大型模型的构建中,需要完整的基础设施升级,而大小模型的开发离不开“算力、算法和数据”三大要素。 其中,硬件代表算力的进步,基础软件代表算法的进步和硬件的效率,数据得到有效的存储、计算和流通。
大型模型带来对计算资源的需求井喷式增长
从2020年到2023年,大模型训练的速度和效率将逐渐提高,对GPU并行性的要求将越来越高。
根据算力需求的计算数据,2023年全球大模型训练所需的算力总量为87万,以H100为例,预计2024年和2025年训练算力需求将以两倍的速度增长。 2023年H100总需求量为83万,2024年将增至265万。 随着大模型的落地,推理端算力需求增长速度超过训练端,推理端算力需求年增长率也超过训练端。
国内领先的智能计算中心全栈软件系统
随着大模型时代的到来,智能计算中心形成了新的产业版图,“算力、算法、数据”三要素从根本上影响了智能计算中心的产业布局和生态发展。
在智能计算中心全栈软件体系建设中,以智能计算硬件为底层,通过GCP智能计算云大规模调度GPU算力,完成算力调度和租户管理,形成AI训练基地。 在AI基础软件层面,为企业提供AI全程训练推理开发工具,支持“大+小”模型开发,提供模型服务。 顶层是大模型生态,通过构建AI MaaS+AIGC应用,有效管理开源大模型和垂直大模型,赋能行业应用。 全栈软件体系的构建最终为企业提供全方位的计算服务、数据服务、算法服务和应用生态服务。
智能计算中心的建设范围包括六个部分:
基础设施和机电配套系统的建设是建设范围内最低的硬件层。 智能算力的采购和供应链,作为第一台GPU服务器,受到供应的影响,成为影响智能算力中心建设进度的最关键因素。 集成智能算力系统,集成了智能计算中心的算力网络和架构存储。 基于云的操作系统是智能计算运营的基础,使能大规模GPU的统一调度、优化、管理和加速。 智能计算运维,包括设备智能运维、对外提供面向企业的特色服务、租户管理、计费运维等。 AI能力构建层,即AI基础软件层,提供“大+小”模型全生命周期的构建、开发、管理和提供服务的能力。 作为中国人工智能基础软件的领导者,DataCanvas为各行业提供智能计算软件系统,包括底层智能计算硬件、支持智能计算应用管理的基仕针智能计算云平台、智能计算云运维管理、智能计算云运营管理、智能计算云操作系统,以及AI平台和大模型,提供大模型训练推理、模型微调、模型操作等全生命周期的开发工作栈,形成AI核心的基础软件能力基础。赋能不同行业的垂直开源模型,提供MaaS服务,最终构建基于智能计算中心的智能计算生态。
第 9 章 DataCanvas 成为智能计算的核伙伴
DataCanvas成立于2013年,以“创造智能,探索未知”为使命,以“助力全球企业智能升级”为愿景,通过自主研发的AI基础软件产品系列和解决方案,为千行百业的用户提供基础AI服务,帮助用户轻松完成数智化转型中模型和数据的双向赋能, 低成本、高效率提升企业决策能力,实现企业级AI的规模化应用。
在新一轮智能计算中心能力建设中,DataCanvas将充分发挥其在机器学习、数据科学和建模领域的专长,从技术支持、产品服务、人才培养、生态合作等方面赋予计算中心“智能核心”,构建有效的计算操作系统,提供越来越便捷的智能计算服务, 并将与不同的智能计算中心形成紧密的合作伙伴,构建高效的计算网络,形成算法基础设施建设,服务智能软件。