自从AMD和英伟达不朽争夺高端市场开始,2000元以下的GPU几乎什么都玩不了。 直到 2022 年英特尔推出英特尔锐炫显卡,回归独立显卡市场,基于 Xe-Core 的 GPU 诞生,XE-HPG 架构进入消费级独立显卡市场,让市场中两人的对抗转为三足立板。
游戏显卡不是用来制造的。 这不仅需要先进的制造工艺和高效的大规模并行处理能力设计,还需要得到游戏引擎和从业者的认可,才能在PC平台上获得出色的兼容性。 尤其是用NVIDIA CUDA Core、Tensor Core、RT Core、Game-ready Drivers构建游戏生态的行业壁垒,就更难了。
即便如此,英特尔ARC依旧利用先进的设计理念和英特尔自身强大的行业号召力和研发能力,让ARC得以持续升级,也相当出色。 就拿我们今天的主角英特尔ARC A750来说,超频版超频版仅需1649元。 说句情理,你还想要什么自行车。
光有**是不够的,只有足够的性能才配得上性价比的描述。 iCard首次亮相近一年半,在游戏、创作、AI、驱动优化等方面取得了怎样的进步,现在不到2000元的成本值得吗? 现在让我们以 Gunnir Intel ARC A750 Photon 8G OC W 为例。
炼金术士出现
在XE-HPG中,代号为Alchemist的GPU率先登上市场舞台,按照计划,Intel ARC品牌未来将包括Alchemist、Battlemage、Celestial和Druid。
在设计方面,XE-HPG并不是之前第13代酷睿GPU使用的XE-LP的扩展版本,而是有了新的设计,即引入了XE-Core核心。 Xe-Core 可以被认为是向量和张量 ALU 的集合,具有 L0 和 L1 缓存单元。 逻辑上接近 XE-LP 子切片,NVIDIA SM(流式多处理器)。 如果你对GPU有所了解,你可能知道单位级别不是一成不变的,例如,NVIDIA在更新架构时修改了SM级别。
每个 XE 核心将包含 16 个矢量引擎 (VE) 和 16 个 XE 矩阵扩展 (XMX)。 这些矢量引擎中的每一个每个周期可以处理 256 位。 如果分解,每个矢量引擎包含 8 个 FP32 ALU,这与 XE-LP EU 大致相同。 由于 16 个矢量引擎每个时钟能够处理 128 个 FP32 操作,即 256 FLOPS 的 FMA 吞吐量,因此就每个时钟的吞吐量而言,它也与 NVIDIA Ampere GPU 相同。
在 XE-Core 中,每 16 个向量引擎与 16 个矩阵引擎配对,用于矩阵和张量计算,英特尔在这里使用专有名词作为其名称,XE Matrix Extensions,缩写为 XMX,这表明了它的重要性。 XMX 主要用于 AI 加速的矩阵张量计算,每个 XMX 引擎都使用一个 8 深度脉动数组。 XMX 每个时钟周期执行 8 个 512 位宽的矩阵计算。 这些矢量和矩阵引擎由一个宽负载存储单元支持,该单元每个时钟周期可以检索 512b 的数据,而每个 xe 内核都有 512kb 的 l1 数据缓存。
尽管 SM 和 Xe-Core 在矢量吞吐量上相当,但英特尔的矩阵运算吞吐量是其两倍,并且可以执行两倍于 ALU 的性能,这意味着英特尔 GPU 仍然倾向于在矩阵计算和 AI 计算上投入更多资源。
在 XE-Core 之上,XE-HPG 的逻辑是渲染切片,它与 XE-LP 一样,为 Intel GPU 提供了大部分功能。 对于 Alchemist,一个切片包含 4 个 xe 核心、4 个光线追踪单元、4 个纹理采样器、几何光栅化前端和 2 个像素后端。 这种 4:4:4 布局意味着在 Alchemist GPU 中,每个 XE-Core 都有自己的纹理采样器和光线追踪单元。
由于 Alchemist GPU 最多包含 8 个切片,因此完整的 GPU 状态包含 32 个 Xe-Core、4096 个 FP32 ALU,支持 DirectX 12 Ultimate,并具有 XMX 矩阵引擎。 然后从此切下来,形成不同定位的独立显卡产品。
英特尔 ARC A750 就是这种情况。 它使用GD2-512 GPU,代号为ACM-G10,基于台积电的6nm工艺,拥有217亿个晶体管,核心面积为406毫米。 与 A770 相比,仅移除了一个渲染瓦片单元,7 个渲染瓦片单元共有 28 个 xe 核心、28 个光线追踪单元、448 个 xmx 引擎和 2 个基本频率05GHz,最高频率可达24ghz,tdp 225w。
不仅如此,作为英特尔ARC GPU的AIC厂商之一,蓝戟也为A750增添了不少色彩。 作为评测,Gunnir Intel ARC A750 Photon 8G OC W 采用了更符合白色主机美学的白色外观设计,并搭配一套名为 ICICLE 的多维散热系统,可以更好地保证显卡的稳定性能。
例如,三旋翼风扇本身支持智能启停技术,可以有效控制显卡的散热噪音,五根镀镍热管+高密度散热片可以提供良好的散热辅助效果。 在实际测试的压测状态下,可以看出GPU核心温度高达58,显卡的外部温度集中在电源部分,在20的室温环境下温度在45左右。
同时,Gunnir Intel ARC A750 Photon 8G OC W 电源部分采用双 8 针设计,与 ATX 3 兼容性很好0.前置电源设计。
在接口配置方面,Gunnir Intel ARC A750 Photon 8G OC W 提供足够的 1 个 HDMI 21 和 3 DisplayPort 20,这意味着ARC A750还可以在接口上支持8K分辨率输出。
游戏驱动持续优化
现在我们进入实战环节,这里的测试平台以酷睿i9-14900K、iGame Z790D5 Ultra、iGame DDR5 16GB 6800*2 Ultra W为参考,主要关注1080P最高画质,以及3DMark基准测试。
在 3DMark 基准测试中,使用了 3DMark Time SPY、3DMark Time Spy Extreme、3DMark Fire Strike Extreme、3DMark Fire Strike Ultra 和 Port Royal 作为参考,在基本级别上略胜于 GeForce RTX 3060 12GB。
游戏环节让我们更进一步。 在文章的开头,我们提到随着时间的推移,英特尔 ARC GPU 驱动程序与游戏的兼容性越来越高。 2024 年 1 月,Arc 显卡驱动再次迎来重大更新,最新驱动 Game On 支持多款新游戏,也为 20 多款热门 DX11 和 DX12 游戏带来了不同的性能提升。 这里我们使用 310.101.4972 驱动器与最新的 310.101.对 5333 驱动器的比较表明,在短短三个月内就有了显着改进。
在《正当防卫3》的情况下,新驱动在1080p的最高画质下提升了160%以上,游戏从基本流畅变成了以超过170fps的高水平运行。 《文明6》是一个明显的提升,帧率提升了35%以上,《消逝的光芒2:人与仁之战》也令人印象深刻,让这款跑酷游戏能够以超过100fps的速度轻松运行。 同时,Apex也有不错的增长。
比如在较新的《赛博朋克2077》的3A级大作中,在开启1080p高端光线追踪的前提下,新驱动带来的帧率提升已经达到了40%以上。 同时,您还可以在设置界面看到 Xess Super Sampling 可以直接启用。
XEss Super Sampling 技术类似于火热的 NVIDIA DLSS、AMD FSR,通过一系列 AI 优化算法,以较低的计算资源为代价,换取更高的性能和图像质量。 与DLSS类似,它是一种结合空间和时间来改善AI图像的技术,即它使用空间数据(相邻像素)和时间数据(上一帧中移动物体的向量)的组合来从神经网络中学习。
事实上,英特尔在宣布ARC品牌之前已经为ARC品牌工作了很长时间,并且已经优化了数百款游戏,使ARC A750在新旧游戏中运行得越来越流畅。
例如,在《反恐精英 2》和《原子之心》中,您可以看到 15% 的增长,而 Hunt: Showdown 可以看到超过 35% 的提升。
还值得一提的是,英特尔ARC驱动直观的控制面板,不仅为游戏组织提供了酷炫的界面,还集成了广播、捕捉、精彩时间捕捉等多种功能。 您还可以打开固定性能面板,以在游戏运行时监控 GPU 的性能。
AI耀眼,创造新专家
强大的并行处理能力使得GPU本身非常适合内容创作工作,英特尔ARC A750在设计XE Core和XMX引擎时,也特意将重点放在内容创作、AI加速、**1编解码器等方面。 举个最直观的例子,英特尔ARC的**1编码和解码能力非常强大,即使使用D**Inci Resolve对2分钟的12GB 4K素材进行编码,实际使用时间甚至可以比GeForce RTX 4090更快。
同时,我们也使用RTX 3060 Ti和RTX 4090来对抗H265格式输出对比,也可以看出英特尔ARC A750真的很凶。
*1 的优点也可以直接用于游戏串流和串流,因为 **1 编码器比 h 更好264 效率更高,在相同的带宽或音量下,**1 可以显示更清晰的细节。 这里我们用《反恐精英2》的**1和**c的现场录音进行对比,在同一场景中,可以清楚地看到,**1流**的建筑物轮廓和枪身更加清晰。
而在Procyon基准测试中,我们也可以看到英特尔ARC A750在处理和处理方面的综合表现,相当不错。
在 Blender Benchmark 渲染输出中,主要检测了 Moser、Junkshop 和 Classroom 三个输出场景,性能如下,与 RTX 3060 不相上下。
2020年工程专业通用Specviewperf。 这是能源勘探、医学、建筑设计、机械设计、汽车设计、飞机设计等领域的专业软件图形测试,包括3dsmax、catia、creo、energy、maya、medical、snx、solidworks等主流软件。 英特尔 ARC A750 已经在大多数专业软件中流畅运行。
最后,英特尔ARC A750也具有良好的AI性能。 这里我们以稳定扩散为例。 Stable Diffusion 是 2022 年推出的一款用于深度学习文本到图像转换的 AICG 工具,由初创公司 Stability AI 与非营利组织和学术人员合作开发,因此比需要付费的 Midjourney 更加开放和可扩展,并提供一系列插件来实现更多功能,例如 AI** 修复、 文本提示引导图像,甚至图像翻译等。可以预见,未来将继续采用更强大的功能。
稳定扩散的前提是至少需要 8GB 的 VRAM 和具有强大 AI 性能的 GPU,否则本地体验不如购买云服务那么简单。 通过直接获取B站的一键运行资源,英特尔ARC A750可以通过中文界面轻松运行稳定的扩散,即使对于新手玩家来说,配置也不再是问题。
在这里,我们使用固定的文本描述来指导 Stable Diffusion 创建 20 个与描述相匹配的建筑景观**。 在UI界面设置ARC A750一次计算2张**,总共运行10次,即20张。 每张**片的分辨率为512x512分辨率,采样步数设置为50,采样方式选择为Euler A。
文字说明如下:
beautiful render of a tudor style house near the water at sunset, fantasy forest. photorealistic, cinematic composition, cinematic high detail, ultra realistic, cinematic lighting, depth of field, hyper-detailed, beautifully color-coded, 8k, many details, chiaroscuro lighting, +dreamlike, vignette
在实际使用中可以看出,ARC A750输出**的效率和质量都不错,完成20**的生成仅需2分14秒,平均67秒生成一个**,根据每分钟图像的算法,公式为60(总时间(batchsize*batchcount))=每分钟图像数,最终生成效率为8每分钟95张图片@512x512是一个非常好的表现,尤其是作为GPU的价格在1649元,表现非常出色。
写在最后:一个高性价比的创意工具
英特尔 ARC A750 的优势在于其强大的多处理能力,尤其是强大的 **1 编解码能力,即使与旗舰 GeForce RTX 4090 相比也是如此。 而随着英特尔驱动的持续优化,玩家的游戏体验与日俱增,英特尔ARC A750在主流游戏中的表现也越来越成熟,部分游戏场景更新游戏驱动后可以得到2倍以上的性能提升,在目前1649元的定位下, 真的让人觉得自己赚了很多钱。
如果你想让AI性能更上一层楼,我还建议考虑配备16GB显存的Intel ARC A770,这不仅性价比高,而且在AI性能上更令人印象深刻,显存更大。
总之,我们从英特尔ARC A750上看到了英特尔在GPU生态、消费类应用、游戏方面的诚意。 在资金有限的前提下,可以获得最新的GPU技术,在很多应用场景中都有很多亮点,再加上蓝戟的第三方设计和良好的散热性能,英特尔ARC A750在安装时就可以写进榜单。