英伟达RTX 5090评测解禁, 天赋都点在了 AI 上
机器之心编译
久等了。
本周三,各路媒体对英伟达GeForceRTX5090的评测宣告解禁。基于最新Blackwell架构,新一代旗舰显卡无疑将成为未来几年你能买到的最好的显卡。

众所周知,英伟达的RTX4090是一款性能强劲的显卡,为真正需要4K游戏的用户提供了强大性能,相比前代RTX3090实现了巨大的性能跃升。自然而然的,该公司最新的顶级GPU——GeForceRTX5090将在1月30日发布时,肩负着人们的巨大期望。
但1999美元(国行16499元起)的售价确实很高——比RTX4090创始版发布价高出400美元。(如果你想在4K分辨率下运行《赛博朋克2077》这样的游戏,可能还需要额外支出更换新电源或支付更高的电费。)
这些额外支出换来的硬件升级包括32GB显存和重新设计的创始版显卡结构,体积缩小到可以装入小型机箱。但最大的优势可能在于软件:RTX5090是第一款支持新DLSS4多帧生成技术的英伟达GPU,承诺带来巨大的帧率提升。在某些情况下,帧率不仅能翻两番,甚至能提升8倍以上。
这额外的处理能力自然带来了更好的性能表现,使RTX5090成为4K游戏的新王者。
但RTX5090相比RTX4090的纯算力提升,并不如RTX4090相对于RTX3090那样显著,尤其是在那些尚未支持DLSS4多帧生成技术的游戏中。虽然现在判断开发者对英伟达最新DLSS技术的采用程度还为时尚早,但这项技术可能比硬件本身更为重要。
这是TheVerge在测试了RTX5090得出的结论:

主要优点:
时尚的双槽设计32GB显存DLSS4让完整光线追踪成为现实
主要缺点:
高达575W的功耗1999美元的高昂价格相比RTX4090性能提升有限

硬件
第一次开箱RTX5090时,创始版显卡的「小巧」令人诧异。虽然新GPU的长宽与RTX4090相当,但厚度却大不相同。相较于RTX4090创始版占用超过三个插槽的厚度,而双插槽的5090非常纤薄,能装入小型主机,为用户提供了更多灵活性。

RTX5090比RTX4090小得多。
但这只是公版,正如此前的一些消息,各家显卡品牌厂商发布的5090都有巨大的体积。
这款双槽设计的关键在于新的散热系统。创始版显卡采用了双向流通风扇,从下方吸入冷空气,将热空气排向机箱上方,而不是从显卡顶部和背部排出。PCB移至显卡中央,散热管道向两侧延伸,从这种新的风扇布局中获得冷却空气。
RTX5090的电源接口略微倾斜,使其更容易安装在侧板靠近GPU电源线的机箱中。英伟达随附的转接线采用四个常规PCIe八针电源接口,与RTX4090的适配器类似,不过这次的线缆更加柔软。这款新GPU支持更新的12V-2x6接口,具有更短的感应针和略长的导体端子,但现有的12VHPWR接口也能与RTX5090完美兼容,因此无需更换新线缆。

英伟达在背板配置了三个DisplayPort2.1b接口和一个HDMI2.1b接口。

RTX5090上的倾斜电源连接器。

Nvidia的RTX5090电源适配器包括四个普通的PCIe八针电源连接器。
由于RTX5090可能消耗高达575瓦的功率(比RTX4090多125W),英伟达建议主机使用1000瓦电源。12VHPWR线缆额定功率为600瓦,留给超频的空间很小。原本希望英伟达RTX50系列能更注重效率而不是继续提高功耗,特别是考虑到RTX4090相比350W的RTX3090已经是一次大幅跃升。令人担忧的是,旗舰GPU的功耗基本已达到单根线缆的极限,希望下一代产品不会需要两根12VHPWR线缆。
4K和DLSS4
在4K和1440p测试中,测试平台搭配了AMD最新的Ryzen99800X3D处理器和华硕32英寸4KOLEDPG32UCDP显示器。这款显示器是RTX5090的完美搭档:240Hz刷新率足以应对该显卡在1440p下能达到的帧率,游戏在开启HDR的OLED面板上看起来极其出色。

为了了解英伟达最新的Blackwell架构(硬件和软件支持改进的组合)在各种游戏中的表现,测试将RTX5090与RTX4090和AMD最接近的竞争对手RX7900XTX进行了对比。测试了最新游戏如《黑神话:悟空》、《使命召唤:黑色行动6》、《刺客信条:幻影》,以及一些常规选择如《赛博朋克2077》、《地铁:离去》增强版,以及《古墓丽影:暗影》。
所有游戏都在RTX5090上使用了非常高或超高设置进行测试,在支持的游戏中启用了各种光线追踪和升级选项,也测试了不支持DLSS或光线追踪的游戏。
4K性能的亮点是DLSS4和英伟达新的多帧生成技术,每个传统渲染帧可以生成最多三个额外帧。它使用最新的AI图形模型,由和ChatGPT同源的更新版Transformer架构驱动,将帧率提升到GPU通常无法达到的水平。本质上,GPU中的TensorCore接收渲染帧,计算下一个到三个帧应该是什么样子,生成这些帧,并在下一个渲染帧之前插入它们。这就是英伟达承诺能在《赛博朋克2077》等游戏中以4K分辨率开启完整光线追踪实现巨大帧率提升的底气。
因此,英伟达主要通过这项新的多帧生成技术来推广RTX50系列,其营销已经重新引发了关于DLSS帧生成的「假帧」争议。一些PC玩家认为这项最初在DLSS3中引入的技术并不能反映GPU的真实性能。
这场争论可能会持续整个GPU世代,但考虑到已有超过80%的RTX用户在游戏中启用DLSS,如果他们升级到最新的英伟达显卡,很可能会转向帧生成技术。
DLSS帧生成的大多数实际问题都与延迟和图像质量有关。英伟达在DLSS4中放弃了之前版本使用的卷积神经网络(CNN)模型,转而采用新的Transformer模型。这意味着帧生成模型更快,使用更少的显存。这一转变也修复了在《赛博朋克2077》中看到的一些图像重影和奇怪的伪影,同时通过多帧生成大幅提升帧率,仅增加了微不足道的6ms延迟。
这是一个不错的权衡,但多帧生成在超分辨率升级后帧率已经不错的情况下效果最好。超分辨率是另一个DLSS功能,通过在较低分辨率下渲染并使用AI升级到输出分辨率来提高帧率并降低输入延迟。例如,一个在4K关闭DLSS时渲染27fps的游戏,使用超分辨率可能会达到60fps。多帧生成可以将其提升到200fps并大大改善动态清晰度,但仍会感觉像60fps,因为它不同于传统渲染200fps带来的输入延迟降低。

多帧生成极大提升了《赛博朋克2077》的帧率。
英伟达提供了《赛博朋克2077》和《心灵杀手2》的早期DLSS4兼容版本用于测试,多帧生成测试主要集中在《赛博朋克2077》上。虽然这款游戏已经发布四年多,但开发商CDProjektRed仍定期为《赛博朋克2077》添加最新的升级和光线追踪技术,将现代GPU推向极限以实现路径追踪。这使其成为基准测试和图像分析的热门选择。
在4K分辨率下,开启完整路径追踪和超高设置,不使用DLSS升级或帧生成时,《赛博朋克2077》运行帧率为34fps。这比RTX4090快近42%,但你确实需要超分辨率和多帧生成来帮助游戏在所有设置最高的情况下达到远超60fps。这显示了软件改进在现代GPU中变得多么重要,虽然DLSS4不会平息关于「假帧」的争论,但它带来的改进是不可否认的。
你也可以选择从2倍多帧生成(DLSS3帧生成)一直到4倍多帧生成。在完全路径追踪的《赛博朋克2077》中,测试者将34fps提升到了使用DLSS超高性能、4倍多帧生成和CNN模型后的371fps。如果选择Transformer模型,你可以避免CNN的图像重影问题,在DLSS质量模式和4倍多帧生成下仍能获得211fps,无需降低到提供较低图像质量的DLSS性能模式。这是基础34fps的六倍以上。
大多数4K测试都没有使用DLSS4多帧生成,因为大多数开发者还没有更新他们的游戏。虽然该公司承诺当RTX5090在1月30日发布时,将有超过75款游戏和应用升级到DLSS4多帧生成,但一些游戏,如《黑神话:悟空》要到今年晚些时候才会升级。如果你实在等不及开发者更新游戏,可以通过英伟达应用强制在游戏中启用DLSS多帧生成。
不过,并非一切都关乎软件改进。在不涉及DLSS或帧生成的情况下,RTX5090在4K下平均比RTX4090快28%。这仍然远不及上两代RTX之间的跨越,但比RTX5090在1440p下的表现要好。
RTX5090在所有测试游戏中都能在4K下实现超过60fps的帧率,其中《黑神话:悟空》最具挑战性,RTX5090达到62fps,而RTX4090为47fps。DLSS在不涉及帧生成的情况下将其提升到95fps。

在4K下的《赛博朋克2077》中,测试者看到了最大的性能提升,在没有DLSS或光线追踪的情况下,RTX5090的帧率比RTX4090高43%。如果将RTX5090与售价999美元的AMDRadeonRX7900XTX相比,性能差距达到惊人的70%,但价格是两倍。

《极限竞速》使用时间反锯齿(TAA)时在RTX5090上的运行速度比RTX4090快35%,测试者甚至在4K下的《古墓丽影:暗影》中平均达到了238fps。


测试者还在RTX5090上运行了一些AI和视频工作负载,以了解它相比RTX4090的能力。RTX5090在PugetBench的DaVinciResolve测试中比RTX4090快约12%,在Procyon的AIXL(FP16)测试中快40%。
1440p基准测试
在1440p分辨率下,RTX的性能提升不如4K显著。《黑神话:悟空》是目前最具挑战性的PC游戏之一,也是唯一一个在不使用FSR或DLSS的情况下,RTX5090无法在1440p下提供超过100fps的游戏。在《黑神话:悟空》中启用75%的DLSS将RTX5090的性能提升到接近120fps——更接近144Hz显示器的利用率——但仅比RTX4090高17%。

《地平线:零之曙光》在RTX5090上使用超高设置和仅TAA时平均达到200fps。这仅比RTX4090在相同设置下高出13%。

《死亡回归》在不使用DLSS的情况下,RTX5090也比RTX4090快19%,《使命召唤:黑色行动6》的情况类似,RTX5090在不使用DLSS的情况下接近200fps,约比RTX4090高15%。


最令人失望的是《刺客信条:幻影》,RTX5090仅比RTX4090提升了8%的性能。

《赛博朋克2077》和《极限竞速》是RTX5090在1440p下比RTX4090提升超过30%性能的罕见例子。在不启用DLSS的情况下,RTX5090在1440p下平均领先RTX4090约18%——总体提升低于上一代,在多个游戏中RTX4090比RTX3090提升超过40%。


DLSS4的多帧生成功能显然也会在1440p下有所帮助,但在TheVerge的测试游戏套件中,只有《赛博朋克2077》在发布前支持它,所以他们的多帧生成测试集中在4K上。
以1,999美元的价格,测试者认为不会有太多人仅为了1440p就购买RTX5090,但如果你在考虑这个分辨率,那么不妨看看即将发布的RTX5080在这个分辨率下的表现。
功耗、风扇和散热

当你将RTX5090推向极限时,风扇会为其降温。
虽然DLSS多帧生成表现出令人期待的早期结果,但RTX5090的功耗令测试者印象不佳。在3DMarkTimeSpyExtreme4K基准测试中,它的峰值功耗达到578瓦。即使在开启完整光线追踪且没有DLSS的《赛博朋克2077》中,它的峰值也达到569瓦,经常维持在500瓦以上。同样的测试在RTX4090上峰值为427瓦。这一代显卡额外的功耗令人非常失望——测试者原本期待英伟达最新芯片能带来更高的效率。
即使赛博朋克2077中没有光线追踪,RTX5090的平均功耗也用到了477瓦。功耗因游戏而异,但在真正吃GPU的游戏中,5090用到的将达到500瓦或更多,这可能会让人有点失望。在无畏契约等网游中,功耗显然会低于200瓦,但你打电竞的话基本不会买到90后缀的产品。
你需要为RTX5090购买至少1000瓦的电源,以便为未来的升级留出空间。这种额外的功耗已经会对电费产生明显影响,老房子可能也要担心一下跳闸。
虽然功耗令人失望,但在体积缩小了的公版RTX5090上进行测试时居然没有明显的发热问题。在开放测试台上,它的最高温度达到70℃,在赛博朋克2077测试期间,风扇转速达到1500rpm。RTX4090在同一测试中温度是64℃。
RTX5090是一款相对安静的显卡,它仍然具有与上一代RTX4090一样的零转速模式,GPU工作较少时风扇会停止旋转。不过,在这种零转速模式下温度最高可达50℃,然后风扇会再次启动,将显卡冷却到更合理的30℃闲置温度。当然如果使用小型机箱时,整个问题就得重新考虑了。
再然后是bug数量的问题,可以注意到的是在一些游戏上,预发布驱动程序有可能导致程序崩溃。无畏契约经常无法启动或在游戏开始前崩溃。最终决战拒绝加载,错误似乎与反作弊有关。前几代英伟达GPU似乎很少出现类似的问题,这个需要等待驱动程序的更新。

RTX5090无疑是当前最强消费级显卡,但摩尔定律延续到了今天,英伟达也无法像RTX4090那样在性能上实现纯粹的性能提升。虽然DLSS4对图像质量和帧生成性能的提升值得期待,但游戏厂商的一侧还有待跟进。赛博朋克2077的早期表现对RTX50系列来说是有希望的,只要其他开发团队能够提供类似的性能提升,并减少插帧后额外的延迟等问题。
英伟达的号召力毋庸置疑,过去的DLSS版本已经证明了它的GPU确实会随着时间的推移而变得更好。另一方面,DLSS4及其新的变形模型也有可能将出现在现有的RTX显卡上,带来进一步的提升。
最后是价格,1999美元对于GPU来说是一笔不小的数目,即使它的显存和架构有了改进。差异化竞争的AMD似乎甚至不会费心与RTX5090直接碰撞,而是在继续选择推动主流级产品。新技术方面,目前尚不清楚其新的AI驱动的FSR4升级与DLSS4相比孰优孰劣。所以,英伟达目前在GPU市场的高端独占鳌头,1999美元是解锁PC游戏所能提供的最佳体验的价格。
如果这个价格或功耗让你望而却步,还有售价999美元(国行8299元)的RTX5080正在路上,2月份还有售价749美元的RTX5070Ti和售价549美元(国行4599元)的RTX5070。
从纯粹的性能角度来看,RTX5090不会像RTX4090那样改变游戏规则。但如果有足够多的游戏能开启DLSS4,那么新一代GPU很可能会引领我们进入一个AI大于纯算力的全新时代。