英伟达用软件的加持打了AMD H100的脸,AI性能比MI300X快47倍!

小夏 科技 更新 2024-01-29

12 月 14 日,AMD 在本月初推出了其最强 AI 芯片 Instinct Mi300X,其 8-GPU 服务器的 AI 性能比 Nvidia H100 8-GPU 提升了 60%。 在这方面,NVIDIA最近发布了一组最新的H100与Mi300X性能对比数据,展示了H100如何使用正确的软件来提供比Mi300X更快的AI性能。

根据AMD此前公布的数据,MI300X的FP8 FP16的性能已经达到了英伟达H100的1比 H100 快 3 倍,可同时运行 Llama 2 70B 和 FlashAttention 2 型号。 在运行 Llama 2 70B 型号的 8v8 服务器中,Mi300X 比 H100 快 40%;运行 Bloom 176B 型号,MI300X 比 H100 快 60%。

但是,应该指出的是,AMD在将Mi300X与NVIDIA H100进行比较时使用了最新的ROCM 300这些数字是从 0 套件中的优化库中获得的,这些库支持 fp16、bf16 和 fp8 等最新的计算格式,包括稀疏性等。 相比之下,NVIDIA H100 没有在没有使用 NVIDIA 的 Tensorrt-LLM 等优化软件的情况下进行测试。

AMD 对 Nvidia H100 测试的隐含声明表明使用了 VLLM V。02.2.2 推理软件和NVIDIA DGX H100系统,LLAMA 2 70B查询的输入序列长度为2048,输出序列长度为128。

以及 Nvidia 最新发布的 DGX H100(配备 8 个 NVIDIA H100 Tensor Core GPU,80 GB HBM3)使用公开提供的 NVIDIA TensorRT LLM 软件 v0 进行测试5.0 表示批处理 1,v06.1 用于延迟阈值测量。 工作负载详细信息和脚注与 AMD 之前的测试相同。

结果显示,在优化软件时,NVIDIA DGX H100 服务器的性能比 AMD MI300X 8-GPU 服务器快 2 倍以上,比 AMD MI300X 8-GPU 服务器快 47%。

DGX H100 可在 1在不到 7 秒的时间内处理单个推理任务。 为了优化响应时间和数据中心吞吐量,云服务为特定服务设置了固定的响应时间。 这允许他们将多个推理请求组合成更大的“批处理”,并增加服务器每秒的推理总数。 MLPERF 等行业标准基准测试也使用此固定响应时间指标来衡量性能。

响应时间的微小权衡可能会导致服务器可以实时处理的推理请求数量的不确定性。 使用固定的 2凭借 5 秒的响应时间预算, NVIDIA DGX H100 服务器每秒可以处理超过 5 次 LLAMA 2 70B 推理,而 Batch-1 每秒不到一次。

显然,Nvidia 使用这些新的基准测试是相对公平的,毕竟 AMD 也使用其优化的软件来评估其 GPU 的性能,那么在测试 Nvidia H100 时为什么不这样做呢?

重要的是要知道,NVIDIA 的软件堆栈围绕着 CUDA 生态系统展开,经过多年的努力和开发,CUDA 生态系统在 AI 市场上拥有非常强大的地位,而 AMD 的 ROCM 60 是新的,尚未在实际场景中进行测试。

根据AMD此前披露的信息,它已经与Microsoft和Meta等大公司达成了很大一部分交易,这些公司将其Mi300X GPU视为Nvidia H100解决方案的替代品。

AMD最新的Instinct Mi300X预计将在2024年上半年大量出货,然而,英伟达更强大的H200 GPU也将在届时出货,英伟达也将在2024年下半年推出新一代Blackwell B100。 此外,英特尔还将推出其新一代AI芯片高迪3。 接下来,人工智能领域的竞争似乎将变得更加激烈。

编辑:新知勋-流氓剑。

相似文章

    AMD推出MI300X,将NVIDIA H100的性能提升高达60%,市场规模预期飙升

    周三,AMD推出了备受期待的全新Mi系列AI芯片,包括MiA和MiX芯片,针对英伟达主导的市场。与传统的计算机处理器相比,这些芯片更擅长处理人工智能训练中涉及的大型数据集。此次发布是AMD年历史上最重要的发布之一,预计将挑战英伟达在热门AI加速器市场的地位。AMD已经发布了超过亿个晶体管的 芯片。M...

    在AMD推出与英伟达竞争的AI芯片后,该公司股价飙升9至9

    AMD股价周四报 收于美元,这是该股自月以来表现最好的一天,也是自月以来的最高价格。一天前,该公司推出了新的人工智能芯片,将与英伟达竞争,为人工智能应用程序提供动力。周三,AMD首席执行官苏姿丰 Lisa Su 谈到了之前宣布的Instinct MiX,这是一款专为面向AI的服务器设计的大型图形处理...

    在与英伟达的决战中,AMD的“最强计算芯片”发布

    人工智能的发展速度比我们想象的要快得多。AMD 首席执行官苏姿丰在 月 日的 AMD Advancing AI 大会上表示。她认为,年AI加速器的市场规模将达到亿美元,年将增长到亿美元。一年前,苏姿丰的 仅从年的亿美元增加到年的亿美元。苏姿丰 到 年,AI 加速器市场将达到 亿美元。这 既是对当前人...

    苹果、AMD、英伟达都在争夺台积电芯片订单,台积电是位居榜首的原因

    苹果 AMD和英伟达都在争夺台积电的芯片订单,台积电是占据主导地位的原因。月日,IT之家报道 苹果 AMD 英伟达在人工智能领域竞争激烈,前段时间与台积电下单,相关芯片将在月后生产。看来,台积电年的业绩又稳了。在失去大客户华为后,台积电并没有倒下,反而一路前行,变得越来越勇敢。不仅营收再创新高,市场...

    与英伟达正面交锋!AMD的“终极武器”今晚就要来了,Microsoft可能会上台帮忙

    月日 科技创新板 邱思宇主编 AMD 将于太平洋时间 月 日上午 点 美国东部时间 月 日凌晨 点 举办一场名为 推进 AI 的活动。据悉,AMD将在此次发布会上推出Instinct Mi系列,包括MI A MI X等,并将突显该公司在AI硬件和软件方面的增长势头。届时,AMD董事长兼首席执行官苏姿...