DLSS3.0暗藏玄机?深入解读RTX40系显卡 技术点评和购买建议

这篇文章我会对40系显卡,尤其是RTX4090做一个技术分析,谈谈台积电4nm制程的优势,着色器重排序SER的意义,DLSS3.0相比其他超采样技术的区别及其问题;当然我也会对各种非公卡做点评,给出购

这篇文章我会对40系显卡,尤其是RTX4090做一个技术分析,谈谈台积电4nm制程的优势,着色器重排序SER的意义,DLSS3.0相比其他超采样技术的区别及其问题;当然我也会对各种非公卡做点评,给出购买建议和对2023显卡市场的预测。

不久前英伟达在GTC2022发布了新一代的RTX40系显卡,采用台积电4nm工艺和Ada Lovelace架构。

DLSS3.0暗藏玄机?深入解读RTX40系显卡 技术点评和购买建议

想不到距离2020年九月30系显卡发布已经过去了两年,英伟达在经历挖矿热潮和芯片短缺后,股价从两年前的130美元一路狂飙到21年末的超过300美元,现在又回落到和两年前同一水平的130美元,真是讽刺。

DLSS3.0暗藏玄机?深入解读RTX40系显卡 技术点评和购买建议

规格提升与台积电4nm
首先我们来看一下AD102的规格,光栅渲染算力90TFLOPS相比3090ti的40TFLOPS翻倍有余,光追算力翻倍到200TFLOP,同时AI算力翻三倍,而且公版TDP仍给在450W,这说明Ada Lovelace的每瓦性能是安培的2倍还多,同时甜点频率上移到2.5GHZ,实现更极致的性能。可以说这个提升幅度是非常巨大的,对我这个原3090现3080用户吸引力足够。

DLSS3.0暗藏玄机?深入解读RTX40系显卡 技术点评和购买建议

实现如此高的性能提升的关键就是换用了台积电的4nm工艺,终于抛弃三星这漏电狂魔了。

台积电4nm优势有三点,首先是足够高的晶体管密度。相比于三星8nm LPP可怜的六千万晶体管每平方毫米,台积电4nm至少拥有一亿五千万晶体管每平方毫米的密度。

DLSS3.0暗藏玄机?深入解读RTX40系显卡 技术点评和购买建议

这也是为何4090的AD102核心(608mm2)能在比上代的GA102(628mm2)更小的晶片上塞下763亿个晶体管,是3090ti的2.7倍。

DLSS3.0暗藏玄机?深入解读RTX40系显卡 技术点评和购买建议

其次是极高的能效比,台积电N4是由台积电5nm节点衍生而来,而30系采用的8nm LPP是三星10nm的延续,从工艺上差了至少两代,能效比提升是1.8倍左右,这也是40系敢于大刀阔斧堆晶体管的原因。

台积电4nm工艺的优势其三就是高频上得去。从苹果M2的3.5ghz到晓龙8gen1的3.2ghz,都证明了台积电4nm的在3ghz以上的高频稳定性以及高频能效比,这也侧面带来所谓“MAX Q”甜点频率的提升,对将来的40系笔记本平台有重大意义。

DLSS3.0暗藏玄机?深入解读RTX40系显卡 技术点评和购买建议DLSS3.0暗藏玄机?深入解读RTX40系显卡 技术点评和购买建议

着色器重排序SER
今年很多40系新闻稿一带而过但我认为非常重要的新技术是SER,Shader Execution Reordering,也叫着色器重排序。GPU的优势就在于并行处理多项任务,尤其是并行相似任务时,成千上万个流处理器的效能比CPU单管线流水线式的处理方式高得多。

DLSS3.0暗藏玄机?深入解读RTX40系显卡 技术点评和购买建议

而40系的着色器重排序SER就是通过算法筛选相似的光追渲染任务并重分配给不同的处理区块,这样就能保证每种任务更快执行,最大限度地利用的GPU并行处理相似任务的优势。

英伟达称SER的创新堪比CPU的乱序执行,能让性能提升25% 。我认为SER将不仅局限于光追优化,在更加普适的渲染场景也会有所应用。

DLSS 3.0特点和问题
接下来我们聊聊DLSS 3.0。简单的说,DLSS3.0相比前代,采用光流法直接运算出完整的中间帧,突破了CPU渲染瓶颈,也是真正“AI完全渲染游戏画面”的开始。

DLSS3.0暗藏玄机?深入解读RTX40系显卡 技术点评和购买建议

事实上DLSS2.0就已经是多帧超采样的算法了,相比于AMD FSR的单帧超采样,DLSS2.0采用深度学习算法自动调参,参考多帧1080p的画面和游戏引擎运动矢量,训练重建多帧4k画面,而且在超采样同时融合了抗锯齿

DLSS3.0暗藏玄机?深入解读RTX40系显卡 技术点评和购买建议

而DLSS 3.0则更进一步,采用全新的光流加速器计算每个像素的运动方向,计算出两帧画面中原本不存在的中间帧,实现帧数翻倍。英伟达称DLSS3仅需GPU运算1/8的画面,而另外7/8则由AI生成,也就是1080p60帧超采+插帧到4k120,帧数分辨率都翻倍,而且超越CPU的渲染帧数上限。

DLSS3.0暗藏玄机?深入解读RTX40系显卡 技术点评和购买建议

DLSS3是非常有前景的,但光流法插帧用在游戏里存在一个重要问题:延迟。要知道用光流法插帧是需要计算像素点在光流场的偏移,也就是至少要两帧画面才能算出中间帧,不可能插到最前面,因为谁都不知道未来是怎么运动的。

DLSS3.0暗藏玄机?深入解读RTX40系显卡 技术点评和购买建议DLSS3.0暗藏玄机?深入解读RTX40系显卡 技术点评和购买建议

这就引入一个不可避免的问题,即使DLSS3.0能极快的插帧到120fps,最新生成的帧延迟仍是至少是60fps的水平。我们来看一个例子,这是官方2077的演示,DLSS2.0下60fps延迟是65ms,DLSS3.0帧数90,延迟67ms,怎么比60fps的延迟还大?

DLSS3.0暗藏玄机?深入解读RTX40系显卡 技术点评和购买建议DLSS3.0暗藏玄机?深入解读RTX40系显卡 技术点评和购买建议

这是因为DLSS3.0的所谓“插帧”只能插中间帧,不能生成最新帧,这也是英伟达在发布会上没告诉你的事情。

在我看来DLSS3.0并不是所谓最新一代DLSS,而是在DLSS2.0的基础上通过光流加速器让运动更平滑,是一种高端版的运动补偿罢了,60帧的延迟还是60帧的水平。

DLSS3.0暗藏玄机?深入解读RTX40系显卡 技术点评和购买建议

但是话说回来,DLSS3.0这种实时插帧的技术证明40系卡的AI算力足够强大,对延迟要求不高的视频插帧将有很广阔的应用前景,若是视频渲染器也能配合DLSS达成实时超分辨率+超采样是非常好的,有望搭载于Madvr和SVP这类软件。

市场和定价
讲了这么多技术层面,我们来看看市场和定价策略。4090公版12999我觉得很香,各家非公估计放开自我,搞个16999甚至18999也不是没可能,毕竟21年的狂热势头历历在目是吧,我就这么说,两万块也有人买。

DLSS3.0暗藏玄机?深入解读RTX40系显卡 技术点评和购买建议

今年的4080很一般,首先是16G版本显存位宽只有256 bit,阉割的过于明显,但定价和4090拉不开差距,非公肯定过万。而12gb版本规格就整个4090的一半都不到,显存位宽才192bit,更关键的是4080 12G用的是AD104核心而非4090的AD102,这卡应该妥妥地叫4070。

DLSS3.0暗藏玄机?深入解读RTX40系显卡 技术点评和购买建议DLSS3.0暗藏玄机?深入解读RTX40系显卡 技术点评和购买建议

看来老黄对30系显卡的清库存压力还是很大,不愿挤占哪怕是3080的定价空间,太不体面了,那就只能期待AMD让它体面。

非公设计点评
顺便我们也来看看各家40系非公的外观设计。首先看ROG,这也太丑了,30系难道就是ROG的设计巅峰吗。猛禽风扇12cm整个比30系大一圈,当然这个散热还是有料的,3.15槽的设计,均热板夹热管,最外层风扇吹透。

DLSS3.0暗藏玄机?深入解读RTX40系显卡 技术点评和购买建议DLSS3.0暗藏玄机?深入解读RTX40系显卡 技术点评和购买建议

接下来看看某嘉,整体还是30系外观,看着像四槽但怎么只给两槽插板,均热板铜管还是不镀镍。技嘉是属于在20系大雕散热吃亏后狠堆料,但一直以来bios功耗给的比较保守。

DLSS3.0暗藏玄机?深入解读RTX40系显卡 技术点评和购买建议DLSS3.0暗藏玄机?深入解读RTX40系显卡 技术点评和购买建议

微星的设计我还是很喜欢的,金属感棱角分明。我现在用的就是3080suprim,而且今年新出了个suprim liquid水冷卡,很有意思

DLSS3.0暗藏玄机?深入解读RTX40系显卡 技术点评和购买建议

看完各家40系设计,能看出来一些类似的思路。第一,短PCB设计配合长散热片大面积吹透;第二,大面积均热板配合多根热管;第三,比厚更厚,比高更高,三槽起步,ITX不要想。

DLSS3.0暗藏玄机?深入解读RTX40系显卡 技术点评和购买建议DLSS3.0暗藏玄机?深入解读RTX40系显卡 技术点评和购买建议

我是认为非公4090是按照600W的散热标准来的,而且今年台积电4nm高频强势,极限性能还是很值得挖掘的。

购买建议
接下来讲讲购买建议,我的基本观点是看好4090,看衰4080。原因是4090相比前代旗舰提升巨大,而4080无论是位宽还是规格阉割太多,在8000-10000的市场站不住。而对于40系旗舰,我会建议购买水冷卡,因为今年的风冷卡过于厚重,而且水冷卡的温度优势非常大。

显卡核心不同于面积较小且容易积热的CPU,水冷对于大核心+核心直触的GPU的压制效果非常好,500w也能压到六七十度。今年EVGA退出竞争,不会有kingkin后,华硕、微星、技嘉、七彩虹都确定有一体水的4090,值得观望。

DLSS3.0暗藏玄机?深入解读RTX40系显卡 技术点评和购买建议DLSS3.0暗藏玄机?深入解读RTX40系显卡 技术点评和购买建议

而且今年在新的12V供电接口加入后,就不会存在某些厂商因为只有2x8pin导致水冷卡调教更加保守的诡异情况。对于30系,我只想说,别买,买也等到AMD 7000系发布看30系跳水。

DLSS3.0暗藏玄机?深入解读RTX40系显卡 技术点评和购买建议

在全球经济下行的压力下,40系显卡的全新架构和翻倍性能会带给DIY市场新的活力吗?我看很难。40系如此高昂的定价的仅限高端为30系清库存的做法,让它必然成为少部分玩家的奢侈品。

DLSS3.0暗藏玄机?深入解读RTX40系显卡 技术点评和购买建议

虽然性能提升巨大,但4080明显定价过高,这次“换代” 更像是狮子大张口。而接下来AMD的7000系从低端到高端的换代则是打破僵局的关键,老黄的40系低端卡又会怎么接招呢?

DLSS3.0暗藏玄机?深入解读RTX40系显卡 技术点评和购买建议

本站部分文章来自网络或用户投稿,如无特殊说明或标注,均为本站原创发布。涉及资源下载的,本站旨在共享仅供大家学习与参考,如您想商用请获取官网版权,如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
科技百科

2022年主流笔记本电脑配置详解 CPU篇

2022-9-25 15:24:41

科技百科

酷睿i9-12900H处理器联想拯救者Y9000P 2022相较i7版有哪些提升?

2022-9-25 15:25:04

搜索