去年年底,AMD 发布了全新的 RX 7000 系显卡,作为旗舰型号,RX 7900 XT 与 XTX 均达到了 AMD 显卡性能的全新高度。此前我们的首发评测将两张显卡一起测试,今天则为大家单独带来了蓝宝石RX 7900 XT 20G D6白金版 OC 的评测。
值得一提的是,这张 RX 7900 XT 的首发价格是 7399 元,但目前市面上大部分品牌已经降至 6399 元左右。下面的测试我们也将着重对比它和 RTX 4070 Ti 的成绩,看看谁更有优势。
1 蓝宝石 RX 7900 XT 白金版 OC 概览
蓝宝石 RX 7900 XT 白金版 OC 的整体外观设计依旧沿袭了 RX 6000 系的风格,但细节部位,和内部散热有所改动。
另外,蓝宝石 RX 7000 系列所有型号显卡均赠送显卡支架,可分担主板受力,防止 PCB 变形。磨砂黑加上 SAPPHIRE 的白色 logo,简洁美观。
蓝宝石 RX 7900 XT 白金版 OC 的尺寸为 313×134×53mm,整体外观设计与上一代相同,不过作为本代 AMD 的准旗舰产品,明显尺寸更大了一圈。
背板也采用了相同的设计,内部散热采用六根镀镍热管配置,配合大型鳍片,散热强悍。耐高温 14 层板多倍铜 PCB,稳定持久。
蓝宝石 RX 7900 XT 白金版 OC 的整卡厚度为 2.5 槽,从侧面我们也能看出来,对比本代的 N 卡,确实相当轻薄。视频输出接口采用了 HDMI 2.1*2+DP 2.1*2 的超时代设计。
最新的 DP 2.1 接口拥有 54Gbps 的传输带宽,支持显示 12bit 色深,以及 680 亿种颜色。同时可支持 4K/480Hz 与 8K/165Hz 的超高清高刷画面显示,不过目前显示器还尚未有实装 DP 2.1 接口的产品。
供电接口上,蓝宝石 RX 7900 XT 白金版 OC 依然采用了双 8pin 接口,非常亲切。整卡功耗约为 320W,推荐电源为 750W。
2 测试平台简介
本次的测试平台我们选择了 AMD 旗舰 Ryzen9 7950X3D 处理器,主板为技嘉 X670E AORUS MASTER 超级雕。(本次所有测试数据均为开启 SAM 后所得)
在测试前我们先来看看截止目前发布的两款 RX 7000 系显卡详细参数,方便大家对比查阅,下面笔者进行了简单汇总:
其实两款显卡在芯片方面的差别不大,其中 RX 7900 XT 相比 RX 7900 XTX 少了一组 MCD,并且两款芯片的晶体管数量均相同。
显存方面,两款显卡的显存容量都有点非同寻常,尤其是 RX 7900 XT 中的 20GB 显存,目前显卡上很少出现;另外 24GB 的显存在 NVIDIA 的 90 级别显卡中会存在,但近几代 AMD 显卡则从未出现。
需要注意的是,在显存带宽上,括号中的 2900 GB/s 与 3500 GB/s 均为经过 Infinity Cache 放大后的最终有效带宽。
频率方面,蓝宝石 RX 7900 XT 白金版 OC 为2449MHz,公版为2400MHz。
3 理论性能测试
下面先进行的是用来衡量显卡 DX11 理论性能的 3DMARKFS 套装:FS,FSE,FSU 三者分别对应显卡在 1080P、2K、4K 的理论性能,取显卡分数实际测试结果如下:
本次测试我们选择 RTX 4070 Ti、蓝宝石 RX 7900 XT 白金版 OC,以及 RX 7900 XTX 三款显卡进行对比。
在针对显卡 DX11 性能的 3DMARKFS 套装测试中,蓝宝石 RX 7900 XT 白金版 OC 相较 RTX 4070 Ti 的提升为FS 28%/FSE 27%/FSU 30%,综合提升 28%。
而在针对 DX12 环境下的 Time Spy 和 Time Spy Extreme 测试中,蓝宝石 RX 7900 XT 白金版 OC 相较 RTX 4070 Ti 在TS 中相差 3%,在 FSE 中提升 4%,综合来说基本持平。
PortRoyal 是 3DMARK 中专门针对光追性能的测试项,蓝宝石 RX 7900 XT 白金版 OC 相较 RTX 4070 Ti提升 2%。
Speed Way 测试是 3DMARK 最新更新的用于测试 DirectX12 Ultimate 性能的显卡基准测试。要运行此测试,显卡必须支持 DirectX12 Ultimate 并包含 6GB 及以上显存。
这项测试结合了实时光线追踪和传统渲染技术来测量显卡性能。场景含有光线追踪反射、实时全局光照、网格着色器、体积照明、粒子和后处理效果。
由于 DX 12 本就是 AMD 显卡弱项,所以在 Ultimate 中分数与 RTX 4080 相差较大,不过也可以看到蓝宝石 RX 7900 XT 白金版 OC 20GB 大显存的优势,在 8K 分辨率下依然有着较为正常的表现,而 RTX 4070 Ti 因为显存不足,导致分数存在严重的错误。
综合来看,AMD 在 DX 11 的测试中依然大幅度领先。而靠着纯纯的暴力性能,在 DX 12 和光追环境中,仍能与 RTX 4070 Ti 中打个平手,下面来看看游戏实测的表现。
4 游戏性能测试
游戏测试方面,由于 A/N 涉及到不同公司的优化,所以性能反映并不如 3DMARK 的理论分数准确,不过我们也为大家测试了几款较为大众的 3A 游戏。
在《极限竞速:地平线 5》中,近期几个大版本的更新一直让成绩起伏不定,本次测试也只代表当前成绩。
在《刺客信条:英灵殿》中,蓝宝石 RX 7900 XT 白金版 OC 展现了 A 卡优化的绝对优势,平均提升都在 15%左右。
在 PS 移植游戏中,《地平线:零之曙光》的 A 卡优化也非常好,在 4K 也能达到百帧的流畅水准。
在《无主之地 3》中,我们测试的同样为 DX 12 环境,蓝宝石 RX 7900 XT 白金版 OC 相较 RTX 4070 Ti 的提升平均在 27%左右。
在《赛博朋克 2077》中的测试项较为特殊,游戏分为“超级”和“光线追踪:超级”两种最高画质,这里我们也分为两部分测试。(AMD 显卡测试均开启 FSR 质量模式、NVIDIA 显卡测试均开启 DLSS 质量模式)
首先来看无光追的成绩,蓝宝石 RX 7900 XT 白金版 OC 的领先幅度依然比较大,平均在 15%左右。
在光线追踪超级预设中,NVIDIA 的优势明显,尽管同样有着 FSR 的加持,但光追游戏的确是 NVIDIA 的主场优势。
不过与自身相比来看,在 RX 7000 系显卡中,AMD 的确进步非常大,与前代相比几乎是“不能用”与“流畅”的天壤之别。
5 FSR 2.2 测试
目前部分游戏已经更新到 FSR 2.2 的最新版本,我们也使用《极限竞速:地平线 5》为大家进行了画质和帧数的实测。
(点击放大看原图)
测试中,我们分别选择 FSR 关闭、FSR 2.2 质量、FSR 2.2 平衡、FSR 2.2 性能、FSR 2.2 超级性能进行对比测试,并附上原图参考。
(点击放大看原图)
整组对比的效果非常明显,不过有意思的是,在 FSR 关闭的情况下,由于原图较为锐利,可以看到在汽车的边缘会出现非常明显的锯齿,而 FSR 2.2 质量模式下才是画质最好的表现,这一情况持续到 FSR 2.2 性能模式依然非常明显。
在 FSR 2.2 超级性能模式中, 颜色边界则会变得有些模糊,但近处的车身表现依然不错。
在帧数方面,质量模式和原生画质相同,在超级性能模式中的提升为 20%。
6 温度及功耗测试
在功耗及温度测试中,我们选择 FurMark 软件进行拷机测试,并采用 GPU-Z 检测温度,功耗仅计算显卡自身。
GPUZ 对于 A 卡的支持并不完全,蓝宝石 RX 7900 XT 白金版 OC 在显卡满载的情况向下,烤机温度在 67℃左右,热点温度为 81℃,风扇转速为 33%。
另外目前 FurMark 对 A 卡也支持了功耗的监测,可以看到试试板载功耗为 318W,峰值大概在 320W 左右。
7 性价比爆棚
参考目前 RX 7900 XT 的普遍售价,大家应该都会想到对比哪款显卡。而在同价位的情况下 RX 7900 XT 的性价比绝对爆棚。
虽然 DX 12 和光追依然是 AMD 的劣势,但 RX 7900 XT 凭借暴力的性能堆砌,强行拉齐了与 RTX 4070 Ti 的差距。并且真正追求光追游戏的玩家,目前仍然是少数。
而 20GB 的大显存优势在 SpeedWay 的测试中尤为明显,这在许多创作软件中将有非常大的优势。
游戏方面,大部分 3A 游戏对性能要求还是非常高的,但 RX 7900 XT 在 2K 分辨率下基本都能打到电竞级帧率,即便是 4K 分辨率也能在百帧左右。
如果你是网游玩家,4K 电竞也不是问题,而 20GB 的大显存在将来还能体验一下超时代的 8K 分辨率。
以目前 6399 元的普遍售价来看,价格更低,性能更强,又让我们看到了那个熟悉的 AMD。
8 RDNA3 架构浅析
AMD RX 7000 系显卡全部采用最新的 RDNA3 架构,而相比上一代 RNDA2 架构,有着翻天覆地的变化,并且也是 GPU 中首次采用大小芯片设计,下面我们来简单剖析一下。
近几年 AMD 显卡进步神速,这离不开“RDNA”架构的功劳,从初代的 RDNA 架构到即将发布的 RDNA3 架构,每年都有大幅提升,而 RDNA3 相比 RX 6000 系显卡所使用的 RDNA2 架构,每瓦性能再次提升 54%。
RDNA3 架构最大的不同则是采用了双芯片的封装结构,其中更加先进的 5nm 工艺为主芯片,而较成熟的 6nm 的制程来打造 GDDR 6 显存接口,和第二代高速缓存 Infinity Cache。
通过 Chiplet 架构,RDNA 3 拥有高达 580 亿个晶体管。用 AMD 的话来说,就是用正确的工艺,做正确的工作。
在 MCD 核心上采用了 Memory Cache,每个 MCD 有 64bit 的 GDDR6 的控制器与第二代 Infinity Cache。通过 Infinity Fabric 连接到 GCD,可提供 2.7 倍的峰值带宽,能够支持在更高分辨率下进行游戏。
根据官方说法,全新的 Infinity Cache 最终有效带宽可达 5.3 TB/s,相比初代提升了 2.7 倍。
在小核心 GCD 中,由三个全新的单元来组成,第一个是统一的计算单元,第二个是新的显示引擎,第三个是新的双媒体引擎(Dual Media Engine)。
在统一的计算引擎中,图形渲染,人工智能和光线追踪之间能够共享计算资源,提供更高的能耗比和更高的单位面积的性能。
共享的资源包括 VGPR——通用的寄存器,容量要比 RDNA 2 多 50%,从而提高了所有功能的性能,能够充分利用这个 5nm 的制成工艺,在更小的面积当中能够封装出更多的晶体管,增加了 165%的密度。
Stream Processor 流处理器,采用了双路 DualIssue 指令分发单元,这使得 RDNA3 架构能够向 Wave32 的 SIMD Unit 发出两路不同的指令,并很好地利用这些数据路径,或者也可以像 RDNA 2 一样并行的使用。
而通过这样加倍的指令分发能力,可以更好地利用计算单元中所有的功能,然后达成更高的性能,更节能。
RDNA 3 的 AI 功能,提高了常用的 AI 运算指令的吞吐量,同时将这些运算指令紧密地结合到统一的计算单元当中,提供了超过 2.7 倍的 AI 性能的提升,让 RDNA 3 可以利用当前的硬件单元来实现未来的人工智能要求。
统一的计算单元的最后一项优化是光线追踪,通过新的着色器指令集以及针对 ray box sorting(Ray Box 排序)和 traversal(遍历)多项的优化,让每个计算单元的光追性能能够提高最多 50%。
所以在纯渲染方面,RX 7900 XTX 是上一代旗舰 GPU 的 1.7 倍,在光线追踪方面性能提高了 1.6 倍。
(8149404)