很长一段时间以来,AMD的显卡销量一直被英伟达击败,双方的差距非常大,近两年的差距甚至更大,很多朋友不明白为什么。
例如,AMD 的 Radeon RX 7600 的游戏性能完全可以赶上 NVIDIA 的 GeForce RTX 4060,而且**也便宜了 30 美元,AMD 显卡的整体性价比明显更高,为什么销量总是处于劣势?
因为图形性能不仅限于游戏性能,还包括生产力性能。 比如各种一流的编解码器,各种工业级3D动画渲染软件,以及现在流行的人工智能计算,这些都是AMD显卡的一大缺点。
这类应用的解决方案往往与软硬件集成,NVIDIA在这方面起步和发展得比较早,其许多技术和解决方案现在已经成为许多专业领域事实上的技术标准。
例如,目前的人工智能领域,包括计算硬件、软件和第三方AI框架(如TensorFlow),都是基于英伟达的CUDA解决方案,这显然对AMD(以及英特尔等其他显卡制造商)非常不利。
如今,几乎所有的人工智能项目和开发书籍都会优先使用NVIDIA显卡,这些显卡不支持AMD显卡,或者效率要低得多,甚至无法直接安装运行。
在这种情况下,只有部分消费级用户会选择购买AMD显卡,主要用于游戏和娱乐,这没有问题。 此外,绝大多数企业用户都会偏爱英伟达的显卡,即使它们要高得多,这造成了AMD显卡和英伟达显卡销量的巨大差距。
目前,人工智能是未来技术发展的大方向,不再局限于商业层面的应用场景,已经开始慢慢渗透到普通消费市场。 比如目前主流的手机处理器都搭载了NPU人工智能计算单元,传闻中的Windows 12也将采用人工智能重构,未来的桌面处理器也会朝着这个方向发展。
这个发展趋势现在已经非常明显了,AMD近年来也开始在人工智能领域积极发力,已经开始追赶英伟达。 例如,AMD在最后两代移动处理器中增加了AI计算单元。
然而,这些努力还远远不够,除了AMD GPU的AI算力外,它还必须为业界拿出一套高效、优秀、可接受的解决方案,类似于英伟达的CUDA计算解决方案。
对此,AMD提出的解决方案是“ROCM”,英文全称是“Radeon Open Compute Platform”,中文名称是Radeon Open Source Computing Platform,是一个开源项目。
习解决方案基于GPU计算,通过开放的编程模型和标准的API,使开发者能够利用AMD的GPU资源进行高效的数据处理和计算,在科学计算、深度习和数据分析领域具有广泛的应用前景。
不过,ROCM自推出以来表现一直不温不火,但AMD并没有放弃,一直在努力改进和完善,AMD发布了ROCM 60,目前开源***
rocm 6.0除了支持 AMD 最新的 Instinct Mi300A Mix300X AIGPU 之外,还有几个亮点:
首先,提高了低精度数学计算和注意力算法的性能。 2. 全新的 HiPSPralsParselt 库可以通过 AMD 的稀疏矩阵核心技术加速 AI 运算。 3. 增加了对 Deepspeed、Onnx-RT 和 Cupy 等库的支持。
4. 支持各种主流AI框架,如TensorFlow、Jax、PyTorch等。 5. 为开发人员提供额外且全面的技术支持,包括 AMD Infinity Hub** 上提供的预打包 HPC 和 AI ML 框架,以及新的和改进的 ROCM 开发文档和资源。
对于 ROCM 60、AMD信心满满,声称ROCM 60 在大型语言模型训练方面已经达到了与 CUDA 相同的水平。
客观地说,AMD在人工智能领域短期内追赶英伟达是不现实的,毕竟英伟达在这一领域已经积累和耕耘多年。 但现在AMD已经开始全力开火,虽然还有差距,但在一定程度上,会对英伟达形成更大的竞争压力,而这始终有利于市场和技术的进步。
至于ROCM 60的实际性能如何?前景如何?能否被大型商用用户接受,目前还很难估计,还有待观察,希望AMD能够稳定而深远。