最后,最后一款RTX 40 Super系列显卡来了,专注于4K高刷游戏体验,初始价格比RTX 4080低1499元,后者是8099元。 如果您最近进行了升级或安装,则需要预算,并希望一步到位地平衡所有内容。 所以今天的NVIDIA GeForce RTX 4080 Super评测肯定会对你有所帮助。
在评估之前,我们照常介绍一下测试平台,具体配置如下:
这一次,所有型号的公版卡都改成了黑色涂装,可以说是颜值上最大的变化。 也正是因为这种细节上的差异,新版的NVIDIA GeForce RTX 4080 Super看起来更加帅气。
开箱公开版卡片本身也是一件令人兴奋的事情,包装非常精致,当像上图一样放在桌面上时,毫不夸张地说,它是一个充满金属科技的“装饰品”。
NVIDIA GeForce RTX 4080 Super 的正面依旧采用X型设计,有一个大风扇几乎占据了一半的面积,左侧的RTX 4080 Super型号文字分别刻在阴影和阴影中,相当精致。 但是,尺寸已变为 35槽卡,所以体积比较大,重量也增加了不少,即使安装机器的时候,还是建议大家戴上显卡支架。
右侧的散热片和风扇都是黑色的,拿在手里很有分量,也有利于更高效的散热。
同样,背面左侧有一个相同的风扇,它创造了一个垂直的风道,可以更好地从显卡内部散热。
NVIDIA GeForce RTX 4080 Super显卡的侧面也是发黑的,在视觉上非常均匀,中间略微做了一点凹弧,以增强质感。 电源接口采用12+4pin设计,使电源更稳定。
接口边框为深灰色,配备 3*DP14A接口和1*HDMI21个接口,最高8K60Hz输出。
配件方面,NVIDIA GeForce RTX 4080 Super 配备了 16pin 转 3*8pin 转接线,与电源的兼容性更强。
GeForce RTX 4080 Super 也基于 AD103 内核构建,但内核规格非常可怕。 例如,它配备了 10,240 个 CUDA 核心,比 RTX 4080 的 9,728 个 CUDA 核心高出 5%2%。它还拥有 52 个 Shader Core TFLOPS 单元和 121 个 RT Core TFLOP,图形游戏性能再次升级。 此外,其 320 个 Tensor Core 和 836 个 AI Tops 将提供强大的 AI 算力和 DLSS 性能。
在内存规格方面,GeForce RTX 4080 Super 仍然拥有 16GB GDDR6X,与 RTX 4080 相同。 然而,64MB 的二级缓存使 GeForce RTX 4080 Super 能够充分利用其 4K 游戏性能。 在GPU频率方面,基本时钟为2295MHz,升压时钟为2550MHz,分别比RTX 4080高40MHz和80MHz。 从显卡规格和官方定位来看,GeForce RTX 4080 Super 是一款定位于 4K 游戏和强大 AI 算力的高端显卡。
当然,GeForce RTX 4080 Super 基于最新的 NVIDIA ADA 架构,基于台积电 4N NVIDIA 定制技术打造,因此可提供高达 2 倍的每瓦性能。 流式多处理器的吞吐量是上一代处理器的 2 倍。 第三代 RT Core 的 DLSS 3 可提供高达 2 倍的光线追踪性能,以及 Tensor Core 的全新 FP8 引擎,可提供高达 132 petaflops 的 Tensor 处理性能,DLSS 速度提高高达 4 倍。
在测试性能之前,让我们先测试一下甜甜圈烤箱,看看它在功耗方面的表现如何。 经过20分钟的烘烤,GPU功耗保持在320W左右,核心温度在69左右,显存温度在70左右,还是比较平衡的,此时的GPU频率可以来2325MHz-2450MHz之间,性能释放还是有保证的。
烘焙结束后,我们对 GeForce RTX 4080 Super 进行了 3D Mark Time Spy 压力测试,看看显卡性能发布在连续高负载下是否流畅耐用,GeForce RTX 4080 Super 以 99 分返回6%的结果,并且始终如一的性能输出非常出色。
接下来是 GPU 理论测试,GeForce RTX 4080 Super 在 3DMark TimeSpy Extreme DX12 测试中获得了 14,401 分,比 RTX 3080 的 8,602 分提高了 67 分4%左右,也比上一代RTX 3090好。
在 3DMark Fire Strike Extreme DX11 测试中,GeForce RTX 4080 Super 的显卡得分为 34,894,比 RTX 3080 的 20,382 分提高了约 71 分2%,相比上一代RTX 3090 Ti的27074分,也有28分8%的提升。
在 3DMark Fire Strike Ultra DX11 测试中,GeForce RTX 4080 Super 的显卡得分为 17,395,比 RTX 3080 的 10,365 分高出约 67%8%,也领先于上一代RTX 3090 Ti的13855分。
在 3DMark Portal Royal 光线追踪测试中,GeForce RTX 4080 Super 得分为 18,439 分,比 RTX 3080 的 11,231 分提高了 64 分1%,光线追踪游戏的性能得到了显著提升。
说到游戏,我们不得不提,NVIDIA平台已经有超过500款游戏和应用支持RTX技术,随着DLSS 3技术越来越成熟和普及,支持DLSS 3的游戏数量也在不断上升。
例如,今年新增了 14 款采用 DLSS 3 技术的新游戏,包括“龙之信条 2 (Dragon Dogma 2)”、“地平线:西之绝境 (Horizon Forbidden West)”、“龙之同仁 8 (Dragon Among Us 8)”、“半条命 2 (Half-Life 2 )RTX”等知名游戏。 此外,已经发布的“战友威克 2 (Alan Wake 2)”、“赛博朋克 2077:往事之影 (Cyberpunk 2077: Shadows of the Past)”、“使命召唤:现代战争 3 (Call of Duty: Modern Warfare 3)”等也首次支持 DLSS 3 或 DLSS 35.技术。 同时,目前主流的热门竞技游戏都支持NVIDIA Reflex技术,可以大大提升低端和电竞选手的游戏体验。
在下一次游戏测试中,我们将测试 6 款游戏,包括 2** 款竞技游戏、2 款传统光栅游戏和 2 款 DLSS 3 支持 3 款5 款光线追踪游戏,所有游戏均以 4K 分辨率进行测试,以验证其在 4K 4K 光线追踪游戏中的性能。
首先是两款**竞技游戏,在 CS2 中,我们使用了默认的高质量选项,以 4K 分辨率玩了一轮,并使用 Frame View 记录了平均帧速率,而 GeForce RTX 4080 Super 能够在 4K 分辨率下平均每秒 305 帧。
此外,通过将游戏设置中的 NVIDIA Reflex 选项打开 + 增强,游戏的平均延迟仅为 9ms,即使在 4K 下,可以说对玩家的影响非常小。
GeForce RTX 4080 Super 在 4K 分辨率下的平均帧率为 350 fps,具有最高的画质,也完全能够满足高分高刷电竞的需求。
至于延迟,《彩虹六号:围攻》也支持NVIDIA Reflex技术,如果在游戏运行时选择带有 Vukan 的选项,会在游戏中找到 Reflex On + enhanced 选项,然后在打开时通过 Frame 抓取,4K 分辨率下的平均延迟只有 102ms,延迟性能相当不错。
然后是2款传统的光栅游戏,在经典的叙事冒险游戏《荒野大镖客:救赎2》中,选择了最高的画质,在4K分辨率下平均帧率可以达到99 fps,而RTX 4080上的平均帧率为95 fps,比RTX 4080提高了42%。
我们还测试了育碧的最新游戏《刺客信条:幻景》(Assassin's Creed: Mirage),并在 4K 分辨率下运行了游戏自己的性能基准测试,使 GeForce RTX 4080 Super 的平均帧速率达到 100 fps,RTX 4080 的平均帧速率达到 92 fps,提高了约 8 fps6%。从测试结果不难看出,在传统的光栅游戏中,RTX 4080 Super相对于RTX 4080的提升相对有限。
那么,GeForce RTX 4080 Super 在光线追踪游戏中的表现如何? IT Home 选择了两款支持 DLSS 3 3 的型号5款光线追踪游戏,其中一款是优化得非常好的“极限竞速:地平线5(Forza Horizon 5)”,选择游戏中的极致画质预设,并开启DLSS 3+DLSS 2画质文件,NVIDIA Reflex选项也会默认开启,我们照常选择Reflex On+Boost,并运行游戏内置的性能基准测试。
进入游戏,选择具有极致画质的4K分辨率,平均帧率可以达到149帧,游戏的平均延迟仅为164ms。RTX 4080 平均 132 帧,改进了约 12 帧8%。
那么,如果我们只打开光线追踪,不打开 DLSS,然后关闭 Reflex 低延迟呢? 可以看到,在《极限竞速:地平线 5》中,4K 光线追踪的平均帧率在不含 DLSS 的情况下仍达到 125 fps,但在没有 Reflex Low Latency 技术的情况下,游戏的平均延迟飙升至 24 fps1ms。
最后,对显卡性能要求非常高的《赛博朋克:2077》,这次我们测试了3次,第一次选择了超强光线追踪画质,开启了DLSS 2画质文件+DLSS 3帧生成,并在4K分辨率下进行了内置的基准性能测试,此时平均帧率可以达到83帧, 这还不错。
第二次,我们选择了超快的光线追踪画质,开启了 DLSS 2 画质 + DLSS 3 帧生成 + DLSS 35 射线重建,此时,GeForce RTX 4080 Super 在 4K 分辨率下的平均帧率为 60 fps,这被认为保持了 4K 60 fps 的底线。
当然,如果完全关闭DLSS,只开启光线追踪,一款4K游戏的平均帧率也只有29fps,毕竟不是所有游戏都能达到《极限竞速5》的优化水平,画质对性能的负荷也不同。 通过对比,不难发现,DLSS技术绝对是游戏玩家最实用的技术。
关闭光重建。
打开光线重建。
然后,您将无法开启 DLSS 35 对游戏的画质有什么影响? 如果看这两张图片,游戏中同一场景中雨后湿滑路面的反射给了我们答案,开启光重建后反射的清晰度有了明显的提升,上一张图片中常见的伪像少了很多,很明显DLSS 35 可以说是高档光线追踪的润滑剂,在保留最高画面效果的同时,也能产生最佳的帧率性能。
正如我们之前提到的,GeForce RTX 4080 Super 还拥有 64MB 的二级缓存、23Gbps 的内存带宽和高达 836 个 AI Tops 核心,这为 GeForce RTX 4080 Super 的创意制作和 AI 性能提供了有力的保证。 用户还可以安装 NVIDIA Studio 驱动程序来加速 110 多款最受欢迎的创意应用,例如 Optix、DLSS 和 Maxine,以及全套 NVIDIA Studio 创意应用,包括 NVIDIA Omniverse、Broadcast、Canvas 和 RTX Remix。
在建模和渲染软件方面,GeForce RTX 4080 Super 的 10,240 个 CUDA 内核提供硬件加速,可提高工作效率。 几乎所有建模软件都优化了 NVIDIA 的 GPU,以提高效率、稳定性和兼容性。 例如,在流行的渲染工具 V-Ray 中,您可以利用 RTX 加速的光线追踪来实现高性能的最终帧渲染。 此外,具有 AI 降噪功能的 GPU 可以进一步加速交互式渲染,从而获得更流畅的工作体验。
从专业生产力的角度来看一下 GeForce RTX 4080 Super。 首先是 V-Ray Benchmark,这是一款建模软件,在 GPU CUDA 测试中得分为 3103 分。
在GPU RTX基准测试类别中,GeForce RTX 4080 Super的最终得分为4292分。
在另一款建模软件Blender的基准测试中,GeForce RTX 4080 Super显卡在三个场景中分别获得了4574、2162、2264的成绩,这也是一个显著的进步。
GeForce RTX 4080 Super 配备 2 个 NVENC 编码器,并支持最新的 1 编码技术,可在相同尺寸下提供更快的编码和更高质量的流媒体性能。 国产建盈专业版已经实现了对nvidia**1**编码器的加速支持,我们也测试过这个,在建盈专业版中导入一个时长为2分30秒的4K**素材,然后使用H。264 编码和 **1 编码用于导出。
如您所见,在相同的 4k 60 帧规格下,1 编码导出的大小为 609MB,h264 编码导出的大小为 800MB,文件大小使用 **1 编码,而 h264 代码的 ** 小了近三分之一。
而在图像质量方面,通过截取两者**的画面细节进行观察,两种编码方式基本没有区别,小而高清,**1势必成为编码格式中的新宠。
然后是 RTX 超分辨率技术,它可以通过 GPU 的 AI 计算将 4K 分辨率从 1080p 升级到 4K,从而实现算法清晰度。 我们只需要在NVIDIA控制面板中找到调整图像设置即可自定义调整,具有4个级别的Superscore。
从左到右:480p、vsr1、vsr2、vsr3、vsr4
我们通过**在IT主站B账号上发了一条帖子**,并将分辨率调整为480p,然后陆续提高超分级别进行截图测试,可以看到1-4个文件下的字符变得更加清晰。
最后,我们还简要测试了该卡在 AIGC with Stable Diffusion 中的性能,并使用了基于 SDXL 开源模型的 SD XL Base 10_0.9vae.Safetensors,以文盛图的形式绘制了21张雪山上的女孩图像,图像分辨率为1024*1024,采样方法为Euler A,迭代次数为50,总批数为10,完成时间为1分55秒。
第二次,我们打开了 Tensorrt 引擎,并在所有其他设置都相同的情况下再次运行它,这次只用了 1 分 1 秒,几乎是一半的时间。
此外,即使在当前测评中图纸参数设置相对简单的情况下,8GB显存使用量也是常态,瞬时显存占用量将飙升至10GB 12GB以上,更不用说更高的分辨率和更复杂的参数设置了。 如果这张卡的视频内存只有8GB,那么对于专业的AI创作者来说,很可能会频繁发生,一旦视频内存不够,图像生成时间就会大大延长,这会非常耽误事情。 这就是为什么 GeForce RTX 4080 Super 的 16GB 显卡在显示器的 AI 方面发挥着非常重要的作用,这与 AI 内容生成的效率直接相关。
相较于我们之前评测的GeForce RTX 4070 Super,这款GeForce RTX 4080 Super显然是针对追求极致4K游戏体验的用户,即主流游戏可以实现4K 100fps的游戏性能,拥有全品质的特效,所以玩家不需要在游戏画质和特效之间做出选择, 尽情享受游戏吧。仍在使用RTX 40系列旧卡的用户,如果想要一步到位的游戏体验,可以闭着眼睛购买。 但是,如果您已经拥有任何 RTX 40 显卡,则可以推迟升级周期。 此外,有AIGC创作或其他AI需求的用户也可以考虑这张卡,这也是目前最适合AI相关工作的。
另一方面,GeForce RTX 4080 Super 的公开版具有出色的做工和质感,以及独特的外形尺寸,这也是许多游戏玩家受到追捧的原因之一。 更不用说,这款首发**比原来的RTX 4080便宜了整整1400元。 有趣的是,如果我们对比上一代RTX 3080Ti,那么你会发现,两者的CUDA核心、Tensors Core、RT核心的数量是一样的,但因为采用了ADA Lovelace架构,各方面的性能都强了很多,功耗甚至更低了30W。