对于AIGC设计师和AI图形爱好者来说,大显存的高端显卡当然是最高效的工具。 目前,由于众所周知的原因,一些高端显卡的**被反复猜测,这大大增加了此类用户的安装成本。 事实上,别忘了,AMD的Radeon RX 7900系列在AIGC性能方面其实是非常强大的,尤其是在流行的AI地图应用中。 此外,AMD显卡的**一直稳定在下滑,因此Radeon RX 7900系列可以说是一款性价比非常高的AI工具,其中20GB大显存的Radeon RX 7900 XT是热门的甜点。
RX 7900 XT采用RDN3架构,大显存,自然适合AIGC
RX 7900 XT采用小芯片设计的RDNA3架构,GCD芯片采用5nm工艺,MCD部分采用6nm工艺,总面积与上一代RX 6950 XT相同,但晶体管达到2超过15倍,因此与上一代RDNA2相比,能效性能显着提高。 此外,RDNA3架构相比上一代增加了一个AI加速单元,无限缓存也升级到了第二代,等效内存带宽为RX 6950 XT的1倍67倍,这也带来了更强大的数据吞吐能力。
RX 7900 XT之所以非常适合AIGC应用,是因为它具有强大的算力,单精度峰值性能高达52 TFLOPS,半精度峰值性能高达103 Tflops,是RX 6950 XT的2.2倍2x 和 218、算力直接决定了AI计算的速度,而RX 7900 XT无疑是这方面的第一梯队水平; 另一方面,它具有 320 位宽度和高达 20 GB 的 GDDR6 显存容量,这意味着它支持更高的 AI 映射分辨率上限,设计人员可以直接生成大图像,而无需花费时间进行高清重建。 在这两个优点中,后者尤为重要,也是显存小的低端显卡无法比拟的。
此外,纵观高端显卡市场,同代竞品16GB显存的RTX 4080已经卖到了8000多元,然后是上万元的天价和买不到的24GB显存RTX 4090,与性价比无关。 相比之下,配备20GB大显存的RX 7900 XT仅花费5000多元,真的可以说是一款性价比高的AIGC武器,再加上现在的一张卡还可以通过Microsoft OLIVE工具优化模型,提高绘图速度,因此特别适合AIGC设计师和AI深度爱好者,需要比基础AI玩家更高。
让我们来看看RX 7900 XT在Stable Diffusion(一种流行的原生AI绘图工具)中的表现。
稳定的扩散图测量:RX 7900 XT大显存特别醒目
测试平台
显示卡: AMD Radeon RX 7900 XT
处理器: AMD Ryzen 5 7600X
内存:ASGARD DDR5 7200 16GB 2
主板:华硕TUF Gaming A620M-Plus
硬盘:WD Black SN850X 2TB
电源:ROG Thor 1600W
操作系统版本:Windows 11 专业版 23H2
适用于 Windows 的 Stable Diffusion 已经添加了对 DirectML 的支持,因此 AMD 显卡也可以在 Windows 10 11 上进行硬件加速。 原来稳定的扩散环境配置和各种设置都比较复杂(主要受网络连接影响),如果麻烦的话也可以选择AI老板做的集成包,这次我们也选择了B站主秋叶做的集成包,简单设置后就可以在高级选项中选择实用的RX 7900 XT在directML模式下加速。此外,由于RX 7900 XT拥有20GB的显存,我们可以直接选择12GB以上显存的模式,以最大限度地提高效率。
当图形被测量时,我们将迭代步数设置为20,欧拉采样A,512 512分辨率,CFG设置为7,模型是一个漂亮的角色模型。 从图中可以看出,在设置一批五张图片时,20GB的显存已经全部用完,而RX 7900 XT此时已经实现了全速输出,完成时间约为22秒。
让我们进一步增加计算压力,一次生成 10 张图,此时 RX 7900 XT 也处于全输出状态,20GB 显存没有明显减速,完成时间约为 47 秒,是 5 张图像 22 秒的两倍多一点。 我们还尝试以纯处理器为参考生成图形,以测试平台的 6 核处理器在大约 3 分 18 秒内生成图形,而 RX 7900 XT 大约需要 6 分钟才能生成图形8秒,快了近28倍,很明显,要做AIGC,高性能显卡确实是首选解决方案。
从Stable Diffusion的剧情测试来看,当一次生成多张图像或生成更高分辨率**时,Stable Diffusion占用的显存量非常大,占用20GB显存的情况并不少见,如果显存小于20GB,可能会因为显存爆炸而影响效率或无法正常产生图像。 因此,对于AIGC设计师或深度AI游戏玩家来说,拥有20GB大显存和出色算力的RX 7900 XT确实是最佳选择。
通过对OLIVE模型优化的支持,RX 7900 XT的AI映射性能再次飙升
我们知道,几个月前,AMD和Microsoft合作优化了Microsoft Olive路径,将基础模型从PyTorch转换为Onnx,从而大大提高了AMD显卡在文盛显卡方面的计算效率。 目前,经过多次版本迭代,使用橄榄优化模型的AMD显卡的设置也变得更加简单,普通玩家可以轻松上手,让我们实际体验一下。
测试环境还在 Windows 平台下,我们需要安装 Git for Windows、Python for Windows 和 Miniconda for Windows,这些去官网**安装,记得确保他们在安装后添加了系统变量路径。 下一步是配置虚拟环境,安装 Olive,将 Stable Diffusion 克隆到本地计算机,并自动启动 Stable Diffusion 所需的组件。 具体操作细节请点击下方链接查看AMD官方教程(注意遇到错误时可能需要将pip和httpx更新到对应版本)。
运行 Stable Diffusion (Olive Edition) 后,进入 ONx 页面,先查看原始模型,然后在 OLIVE 页面点击优化 ONx 模型,然后点击 使用 Olive 优化模型按钮优化模型,大约 3 分 27 秒即可完成优化。
优化完成后,可以在主界面左上角选择原始模型或橄榄优化模型进行绘图对比。 这里提醒大家,第一次备份后要备份原来的ONx模型,以免直接在原来的路径上覆盖OLlive优化模型,不方便多次比较。
那么,RX 7900 XT在Olive优化模型后,地块生产速度提高了多少呢? 从图中可以看出,我们选择一次生产两批图纸,每批三张,总共六张。 28完成需时9秒,优化后仅需13秒,输出速度提升高达122%! 由此可见,优化效果非常明显。
事实上,如果RX 7900 XT在Linux环境下使用ROCM平台运行Stable Diffusion,绘制效率会提高数倍,因此专业用户也可以关注Windows平台上的STAG Diffusion的ROCM版本(RX 7900 XT完全支持ROCM运行时和hip SDK, RX 6750 及以下版本仅支持 Runtime)。从这个角度来看,RX 7900 XT不仅能让你立即享受到极高的AI性能,而且具有极深的“为未来而战”的潜力。
总结:AIGC是一款专业高效的工具,RX 7900 XT在性价比方面遥遥领先
从前面的分析可以看出,RX 7900 XT不仅拥有旗舰级的算力,还拥有20GB的超大显存,超过了RTX 4080的16GB显存,更大的显存也更有利于AI映射的分辨率和效率。 同时,RX 7900 XT的价格仅为拥有更大显存的RTX 4080的61%,性价比可以说是真的遥遥领先。 从稳定扩散的实际测量来看,在地图数量增加的情况下,对显存的需求确实非常高,而RX 7900 XT的20GB大显存刚好可以发挥它的威力,也能保证在连续映射的情况下没有误差, 同时也保证了测绘的效率。此外,我们还可以看到,使用Olive优化模型后,RX 7900 XT的输出速度进一步翻倍,相当于给用户带来了免费的性能升级,而未来,如果Windows平台有更完整的ROCM版本的Stable Diffusion,RX 7900 XT可以更加强大, AI性能可以直接起飞。因此,对于专业AIGC应用需求高的专业用户来说,而不是简单地画图好玩,RX 7900 XT可以说是他们非常合适的选择。
此外,我们还选择了两款旗舰AI电脑配置进行对比,AMD平台使用Ryzen 9 7950X和RX 7900 XT的组合,Intel平台使用Core i9 14900K和RTX 4080的组合。 从总价可以看出,AMD的配置拥有5350元的优势,同时显存也更多为4GB,不仅能在AIGC应用中发挥出强大的性能,在其他生产力应用中也具有一流的性能,是一款性价比高的全方位解决方案。英特尔平台的总价格高出36%,性价比明显落后,显存也更小,在AI映射或其他生产力应用中也不能幸免于更多限制。
总而言之,如果你需要经常面对更专业的AIGC应用,尤其是大显存,又想享受极致的性价比,那么RX 7900 XT确实是非常值得优先考虑的。