在GeForce RTX 4070 Super和GeForce RTX 4070 Ti Super首次评测后,Super的性价比越来越扎实,结束NVIDIA的GeForce RTX GPU SUPER更新只是一个旗舰定位Super,而这个重任就落在了GeForce RTX 4080 Super身上。
从定位和参数来看,GeForce RTX 4080 Super 已经相当有能力玩了,不仅比 GeForce RTX 4080 的起价便宜 200 美元,官方起拍价 8099 元更实惠,而且在性能方面也一步到位,触及了 AD103 的天花板。 是的,如果 GeForce RTX 4080 Super 走得更远,它真的可以融入 RTX 4090 系列。
撇开玩笑不谈,GeForce RTX 4080 Super 的性价比再次让我们觉得 NVIDIA 投入了足够的资金来升级 Super 系列,这也意味着这款 GPU 在生成式 AI、DLSS 和光线追踪游戏以及内容创作方面拥有更强大的战斗力。
那么真的是这样吗? 现在让我们来介绍一下我们对 NVIDIA GeForce RTX 4080 Super Founders Edition 的首次评测。
AD103的终极演进
GeForce RTX 4080 Super 最令人印象深刻的是代号 AD103-400-A1 核心。 我们知道,AD103保留了AD102的所有主要特性,并采用了源自台积电4N定制工艺的ADA Lovelace架构,具有459亿个晶体管,核心面积为379mm。
在 ADA Lovelace 架构中,GPU 包含多个 GPC(图形处理集群),GPC 包含多个 TPC(纹理处理集群)、多个流式多处理器 (SM),然后是 CUDA 和 RT 内核、张量内核等。 每个 GPC 中包含的 TPC 数量相等,并且当 GPU 定位和区分时,GPC 和 TPC 是物理屏蔽的。
完整的AD103包含7个GPC,但每个GPC包含不同的TPC。 如下图所示,虽然 6 个 GPC 中的每一个都有 6 个 TPC,但也有 1 个 GPC 只有 4 个 TPC。 例如,在 RTX 40 系列发布时,GeForce RTX 4080 是通过屏蔽 1 组 TPC 来实现的。
有趣的是,同样使用AD103的GeForce RTX 4080 Super显然不会在核心配置上做出任何让步,仅从核心代号AD103-400-A1就知道,这款GPU并不简单。 是的,GeForce RTX 4080 Super 是完整的 AD103,具有 10,240 个 CUDA 核心、80 个 RT 核心、320 个 Tensor 核心、320 个纹理单元和 112 个 ROPS。 在内存子系统上,总共有 10,240KB 的 L1 缓存、20,480KB 的寄存器堆和 65,536KB 的 L2 缓存。
不过需要注意的是,相较于专业GPU的3个第8代NVENC和3个第5代NVDEC配置,GeForce RTX 4080 Super Encoder配置了2个第8代NVENC和1个第5代NVDEC有所作为,这是消费级GPU的常见操作,对游戏性能和AI加速性能影响不大。
不仅如此,GeForce RTX 4080 Super 的提升频率也为 255GHz,搭配256位16GB GDDR6X,显存带宽达到736GB S,TGP仍与RTX 4080相同,为320W。 另外值得一提的是未经审查的 64MB L2 缓存,比 GeForce RTX 3080 的 5MB L2 缓存多 12%8 倍,这使得这在游戏中成为光线追踪的巨大优势,尤其是路径追踪。 第三代 RT Core 和 **Tensor Core 可以更好地发挥 L2 缓存的效果。
至此,CES2024发布的三款GeForce RTX Super已经发布,这里我们不妨用RTX 4080进行对比,大致规格如下。
黑色盔甲
SUPER版Founders Edition最大的不同是,用于加固的黑色中框变成了深黑色,突然看起来先进了许多。 不过整体设计思路变化不大,主要依靠错位风扇和异形PCB的对称设计来改善GPU的散热。
在选材方面,GeForce RTX 4080 Super Founders Edition采用一体成型,散热鳍片采用99%铝合金,兼具重量轻、刚性可靠、导热性好等特点。 同时,散热鳍片再次加厚,变成三槽设计,挡板末端的支架孔隐藏在磁性挡板下方,只需一个指甲即可撬开,恢复后只需将贴片放回原处,磁力就会自动吸附。
在风扇选择方面,GeForce RTX 40 系列 Founders Edition 基本上将风扇叶片直径提升至 116mm,每分钟产生的气流足以填充 35个篮球。 此外,风扇叶片由增强玻璃纤维制成,具有弹性,可与动态轴承一起使用,以获得更好的静音性。
风扇下采用6根带散热鳍片的热管设计,电源继续采用最新的16pin(12vhpwr)接口,机器采用3x8pin转接线包装配送,TGP为320W。
在实际游戏测试中,GeForce RTX 4080 Super Founders Edition的性能特别高,在4K游戏环境中的功耗通常保持在250W以下。
接口设计包括三个 DisplayPort 14A 和 1 x HDMI 21 个接口。
在压力测试中,GeForce RTX 4080 Super Founders Edition 的 GPU 温度和表面温度并不高。 比如GPU温度只有58,红外检测可以看到整个机箱处于相当凉爽的状态。
激活超级战斗力
现在让我们进行测试,其中包括酷睿i9-14900K,ROG Maximus Z790 Dark Hero和G技能 Trident Z5 DDR5-7200 16GBX2 支持 1250W 电源。
在基本性能测试中,主要参考是 3DMark Time SPY、3DMark Time Spy Extreme、3DMark Fire Strike Extreme、3DMark Fire Strike Ultra 和 Port Royal,它们衡量 DirectX 11 和 DirectX 12 的性能。 可以看到,GeForce RTX 4080 Super 比 RTX 4070 Ti Super 好 20% 左右,如果与上一代 RTX 3080 相比,增幅高达 70%。
因此,如果您使用的是 DLSS 2 及更早版本的常规游戏,GeForce RTX 4080 Super 的起始分辨率为 4K 最大画质,比 RTX 3080 Ti 快 80%。 与GeForce RTX 2080 Super相比,GeForce RTX 4080 Super的改进相当夸张,范围从150%到250%。
DLSS 3 和 DLSS 3 引入 GeForce RTX 40 系列5 技术最为重要,由于 Tensor Core 性能的巨大提升,辅以光流加速器(OFA)和DLSS的结合,构建了更加立体化的分析方法,使GPU的实际执行过程被压缩到原来的1 8。
dlss 3.5是一套基于AI的算法,可以同时提高图像质量和帧率,包括DLSS帧生成(FG)和光线重建(RR)技术,加上超分辨率(Super Resolution)、DLAA、帧生成(Frame generation)等技术集成。
如果用RTX 3090作为对比,你会发现,即使有24GB显存的加持,RTX 3090在画面流畅度方面,无论是4K还是8K分辨率,都弱于GeForce RTX 4080 Super。
在 DLSS 3 及更高版本的游戏中,GeForce RTX 4080 Super 证明了其战斗力。 在这里,我们直接打开4K最高画质,打开光线追踪或路径追踪。 如您所见,GeForce RTX 4080 Super 与 RTX 3080 Ti 相比最多可以提升 60% 到 200% 以上,而与 RTX 2080 Super 相比,最大提升在 800% 以上,当然是因为 GPU 无法推动它,而且从总体结果来看,GeForce RTX 4080 Super 比 RTX 2080 Super 提升 300% 不是问题。
即使是 DLSS 3 和 Reflex 的融合,GeForce RTX 4080 Super 在竞技游戏中也更加令人印象深刻。 特别是在 1080p 分辨率下,《无畏契约》和《反恐精英 2》等游戏的帧率达到了 300 fps 以上,系统延迟通过反射降低到 10 毫秒以下。
这里我们使用 DLSS 3《赛博朋克 2077》的 5 个画质对比,可以在 DLSS 3 中看到5 借助光重建,湿反射变得清晰自然,物体边缘在暗影中依然呈现出光反射的效果,这主要是在获得更高帧率的前提下实现的。
人工智能和创造非常有能力战斗
接下来是 AI 测试环节。 GeForce RTX 4080 Super (配备 16GB GDDR6X) 是生成式 AI 向前迈出的一大步。 这里我们不妨以 Stable Diffusion XL 为参考,Stable Diffusion XL 本身需要依靠 Transformer transformer 和卷积神经网络来运行,两者都需要 GPU 进行大规模并行计算,这无疑是 NVIDIA 最擅长的。 正因为如此,近年来AI的快速发展很大程度上是由NVIDIA GPU技术的发展推动的。
这里选择的 Stable Diffusion XL 是相当稳定的 Diffusion 15 是 3 倍大,导致要计算的数据量更高,而且图像质量也更好。 这是用 Stable Diffusion Web UI + TensorRT 配置的,用更短的语言描述生成 10 张分辨率为 768x768 的星际航行图像**,每次操作 1 张**,即总共 10 次执行,采样步骤数设置为 50 步。
文字描述为:水星球上空的史诗般的太空战,许多飞船,电影照明,景深,超细节,精美的颜色编码,8K,许多细节,明暗对比照明。 通过记录时间,计算出每分钟的估计效率,参考公式为60(总时间(batchsize * batchcount))=每分钟图像数。
GeForce RTX 4080 Super 的性能轻松胜过许多参与最近评测的 GPU,即使与相同显存的 RTX 4070 Ti Super 相比,它的性能提升也提升了 25% 以上,这是一个相当显着的提升。 这意味着 GeForce RTX 4080 Super 已经可以用于本地 AI 部署,无论是现在的文盛图加速、图生成,甚至是**生成,还是大型语言模型加速,GeForce RTX 4080 Super 都提供了非常丰富的算力基础。
同时,国产软件D5渲染器对DLSS 3也有不错的影响5 AI加速提供支持。 由于 DLSS 35 它使用比 DLSS 3 多 5 倍的数据进行训练,因此它还可以更好地识别光线追踪效果,并对时空数据做出更合理的判断,从而实现高效缩放。
在真实世界测试的极简别墅 1 场景中,GeForce RTX 4080 Super 让 D5 渲染器运行得极其流畅,轻松超过了 60 fps 的流畅度,比一周前的 RTX 4070 Ti Super 提升了 35% 以上。
不仅如此,DLSS 35的加入也使场景发生了质的变化。 当 DLSS 35.关闭后,地面上的反射变得非常粗糙,左侧的玻璃也失去了折射效果和透明度,帧率降低到原来的一半以下。
最后的 AI 测试是使用 On1 Resize AI 2022 来提高 ** 分辨率。 可以看出,GeForce RTX 4080 Super 在最短的时间内完成了分辨率提升,比 RTX 3080 缩短了一半。
大量的 Cuda Core 和 RT Core 也是 GeForce RTX 4080 Super 的强项。 在 V-Ray 5 基准测试中,Cuda Core 和 RTX 是分开测试的,在 Cuda Core 较多的情况下,GeForce RTX 4080 Super 在 CUDA 性能和光线追踪方面都有很强的表现,比 RTX 3080 好 60%。
另一款 Octane Render RTX 用于测试 GPU 的光线追踪性能,测试 GPU 在复杂场景中生成的采样率,GeForce RTX 4080 Super 比 RTX 3080 好 50%。
此外,在 Blender 基准测试引入的三个参考场景中,GeForce RTX 4080 Super 比 RTX 3080 高出 80%。
在专业软件创建环节中,我们引用了 SpecViewPerf 2020,这是对在 OpenGL 和 Direct X API 下运行的系统的 3D 图形性能的特殊测试,包括 3DSMAX、Catia、Creo、Energy、Maya、Medical、SNX 和 SolidWorks。 与 RTX 3080 相比,GeForce RTX 4080 Super 的帧速率提高了 50% 至近 90%,适用于专业应用。
写在最后:定义超上限
GeForce RTX 4080 SUPER 的一大优点是,它以比 RTX 4080 更便宜的定价策略实现了目前的 Super Ceiling,完整的 AD103 GPU 没有让人失望,RTX 4080 的战斗功耗没有提升,4K 分辨率下的 DLSS 3 游戏表现令人惊叹。
事实上,GeForce RTX 4080 Super 已经是一款可以充满特效的 GPU,在 4K 分辨率畅运行所有杰作,你所要做的就是进入游戏,游戏的检测系统会自动调整最高配置,或者手动将画质滑块拉到头上,体验玩游戏永远不看画质设置的人生巅峰,此时8099元的定价将特别划算。
在游戏之外,GeForce RTX 4080 Super 已经证明自己是一个多面手,无论是通过 Stable Diffusion XL 还是 DLSS 3 加速生成式 AI5 个加速 D5 渲染器,或海量 CUDA 核心,用于加速 3DSMAX 和 CATIA 等专业软件,或替换为 NVIDIA Studio 驱动程序以访问 NVIDIA Omniverse 元宇宙。
GeForce RTX 4080 Super 是一款可以轻松变成全能型 PC 的 PC,因此即使您是专业的美术师、设计师或游戏开发人员,也可以加速这款 GPU 或专业应用程序的快感。 特别是搭载16GB GDDR6X超大显存的GeForce RTX 4080 Super出色的AI性能,让用户无需再为AI服务付费,依托GeForce RTX 4080 Super的本地AI性能,轻松实现文生图、**代、大语言模型加速,为即将到来的本地化AI时代提供了充足的计算基础。
而这款代表当下Super系列最高上限的产品,也很好地诠释了性价比。 如果您想获得充足的 AI 性能并以最高质量运行 4K 的 3A 游戏,并且想要轻松使用**、图形或专业软件,那么 GeForce RTX 4080 Super 是适合您的 GPU。