人工智能 (AI) 和机器学习 (ML) 技术正在蓬勃发展,对高性能计算 (HPC) 和大规模数据处理的需求正在上升。 目前的GPU互连端口已经快速升级到800G(2x400G),下一代有望演进到16T(2x800G)使得数据中心对光互联的带宽需求越来越迫切。
AL ML集群互联互通
HPC和数据中心互联面临新挑战
随着AI ML集群规模的快速增长,加速卡的数量从几百张扩大到几万张,集群的互联距离也从几十米延伸到几百米。 这导致对低功耗和低延迟的需求变得尤为迫切,而传统的电子交换面临瓶颈。 同时,HPC也面临着更高的要求,包括集群规模的灵活配置和网络的长期稳定运行。 大规模数据中心互联也面临着主干交换机性能瓶颈和端口速率演进的挑战,随着速度的提升,单纯依靠硬件升级并不能显著提升200G及以上速度的能效,需要通过架构重构进一步提高能效,降低运营成本。
AI模型规模的演进
支持软件定义网络 (SDN)。
全光交换解决方案应运而生
为了应对这些挑战,全光交换(OCS)解决方案应运而生。 OCS通过其全光交换的优势,实现了光信号的透明传输,支持光纤中任意速率调制格式通信波长的光信号的交换,具有无时钟抖动、无延迟、无数据读取、无泄漏风险等特点。 此外,OCS 还支持软件定义网络 (SDN) 支持控制,从而提高了系统灵活性。
OCS全光交换解决方案已成功应用于部分头部数据中心,去年12月6日,谷歌推出人工智能模型Gemini,支持硬件TPUV5版本,加强了OCS光交换技术的应用。 在 Google TPUv4 的应用中,OCS 显著提高了集群互连的可靠性,即使主机可靠性下降到 99在0%的情况下,TPU切片的优异性能仍能得到保证,系统整体性能提升6倍以上。
Google TPU 集群大小演变
AI算力“军备竞赛”。
OCS解决方案应用广泛
软件定义全光交换在高性能计算和数据中心应用中具有卓越的性能,为AI网络的发展提供了重要支撑。 随着数据中心的发展,OCS全光交换技术将在光互联领域展现出更广阔的应用前景,为数字化转型的成功注入新的活力。 AIGC大模型时代必然引发算力的军备竞赛,有望通过推动计算芯片和网络的升级,推动行业的长期增长。
随着集群规模的扩大,将需要更大的端口 OCS,并且需要提高 OCS 的可靠性和回插损耗性能。 基于DirectLight直接光束偏转技术的OCS解决方案具有超低损耗和回波损耗、高抗震性等优异性能,在运行成本、吞吐量、功耗和成本方面取得了显著效益。 除了智能计算中心的应用外,还广泛应用于卫星互联网和量子互联网,OCS将成为6G时代空天地一体化网络的重要组成部分。
直射灯技术原理
凌云光大矩阵全光交换解决方案
自2024年以来,凌云一直专注于光交换技术、产品和应用的推广,并于2024年与全球光交换制造商H+S Polatis正式建立战略合作伙伴关系,共同开创光交换应用新时代。 H+S Polatis 为远程光纤层配置、保护、监控、重新配置和测试提供低损耗、全光交换解决方案。
H+S Polatis 6000 7000 系列全光开关具有出色的性能,支持完全无阻塞的 8 8 576 576 矩阵栅尺,具有出色的抗震性,并支持航空航天级应用。 超低插入和回波损耗,优异的光学指标,支持单通道双向传输和暗光纤交换,全光透传,独立速率协议,支持400G 800G及以上速率平滑升级,可选N N对称和任意端口配置结构(CC系列),满足SDN应用。 可广泛应用于AI智能计算中心的全光交换、卫星互联网、量子互联网、产线自动化测试等应用场景。
H+S Polatis 6000 7000 系列全光交换机