业界首款!美光推出低功耗压缩附加内存模块:速率最高9600MT/s
2024-05-17 3216510
2023-10-30 0
DLSS技术一直是老黄的拿手好戏,从RTX 20系上DLSS 1.0的出现,这项超分技术就给游戏体验带来了前所未有的丝滑体验,再到后面,不断迭代升级,DLSS也更新至3.5版本,它一共由四个部分组成,分别是超分辨率,帧生成,Reflex低延迟,还有新增的光线重建技术。
前面的三个部分,大家应该已经熟悉得不能再熟悉了,它们在RTX 40系显卡上已经表现得凌厉尽致。这次我们要探索最新的光线重建技术(Ray Reconstruction),看看它究竟能够带给游戏什么新的改变。
为什么要光线重建?
在正式开始测试前,我们还是要简单的说说这个光线重建技术的由来。光线重建的基础是光线追踪,光线追踪说白了就是一种在2D屏幕上呈现3D图像的方法,如果你想了解光线追踪,你可以环顾四周,找到被光线照亮的物体,沿着到达视点的光线反方向进行追踪,就是光线追踪。
不过,光线是数不胜数的,如果你想对屏幕上的每个像素都进行光线计算,那显然不实际,因此,必须使用光线采样,即向场景中的各个点发射少量光线,作为场景照明、反射率和阴影的代表性样本。
仅有少部分光线采样后的画面,只可以看到基本的场景,并且还有大量的噪点,这显然还不足以游玩。接下来就该降噪器出场了,降噪器会通过多帧结合或空间插值的方法填充画面内的缺失的像素,从而打造出完整的图像。
而负责这项工作的就是传统的光追管线,在操作上是创建几何以及材质,然后对其进行光追计算,再由上面的降噪器降噪后,最后调整并拉伸图像,从而得到我们玩家所见到的游戏画面。
不过传统光追管线这样操作后会有不少问题,比如多帧合成容易产生鬼影,甚至图像上有些细节没办法完整的显现出来,就好像下图所列出的效果一样,这对游戏体验影像还是蛮大的。
值得一提的是,不同类型的光追效果其实还要用到多种降噪器处理,才能算出相对满意的画面,这不但增加了开发成本和复杂程度,且多个降噪器同时工作也会极大降低光追游戏中的帧数。
DLSS 3.5究竟有什么升级?
为了解决上面提到的问题,光线重建技术就出现了。这项技术实装在DLSS 3.5中,它将之前需要人工设计的降噪器替换为了NVIDIA超算训练的AI网络,它能够在采样光线时生成更高质量的像素,从而提高光线追踪的图像质量。
说白了,光线重建技术RR更像是一套专为”光线“定制的DLSS,它的目的就是解决人工降噪器带来的细节缺失问题、鬼影问题等。
光线重建会使用离线渲染图像进行训练,这项训练所需的计算能力往往比实时游戏所需的更多,因此更强悍的RTX 40系显卡才能给你带来绝佳的体验。
并且光线重建可以从训练数据中识别光照模式,例如全局光照或环境光遮蔽的光照模式等,这也是为什么目前只有《赛博朋克2077》的全景光追模式支持DLSS 3.5的原因。
不仅如此,DLSS 3.5在训练量上也比DLSS 3提升了不少,官方宣传,前者的训练量是后者的5倍,因此DLSS 3.5可识别不同的光线追踪效果,从而可使用时间和空间数据做出更明智的决策,并保留高频信息以实现更高质量的升级。
总的来说,得益于DLSS 3.5的升级,你的RTX显卡有了质的变化,它既可以利用NVIDIA超级计算机中数十亿个数据点训练的DLSS AI模型去提高游戏性能和图像质量。
还可以充分使用RTX显卡内部专用的 Tensor Core,辅以专用的 RT Core、Shader Execution Reordering(着色器执行重排序)等创新技术,带给你更快、更好的游戏体验。
所有RTX显卡都能支持DLSS 3.5?
上面说了那么多DLSS 3.5的厉害之处,那你也肯定想知道,到底有哪些显卡支持。根据NVIDIA的说法,DLSS 3.5不仅支持RTX 40系显卡,而是所有的RTX显卡都可以开启。
不过RTX 20系与RTX 30系的DLSS 3.5与RTX 40系的还有不同之处。本次DLSS 3.5并不是DLSS 3.0的更新换代版,而是在DLSS 3.0的基础上增加了RR(Ray Reconstruction)功能。你可以理解为是在原有的基础上加了一个DLC。
所以,如果你想要体验完整版的DLSS 3.5,你还是需要一张RTX 40系显卡,它支持超分SR(Super Resolution)、帧生成FG(Frame Generation)以及光线重建RR(Ray Reconstruction)。而RTX 20系与RTX 30系仅有超分SR和光线重建RR,最关键的帧生成依旧不支持,这只能说刀法还是老黄精准。
硬件赏析
硬核的技术讲解结束了,接下来就该硬件登场了。想要体验光线重建技术,那得选用一张强势的游戏显卡。
我们这回上手的是技嘉的GeForce RTX 4080 16GB GAMING OC(下文简称”技嘉RTX 4080 魔鹰 16G“),正面外观上还是一如既往的”魔鹰“风格,超大尺寸的散热器+吹透式设计相当强势,配合这个黑色的外壳,妥妥的电竞旗舰显卡。
漆黑的外壳上还有各式各样的斜切线条作为装饰,犹如鹰爪的痕迹一般,犀利惊艳。当然了,要说最吸引人的还是要属标志性的风之力3风扇散热系统。几乎已经占据了整张显卡的外框,散热效能令人期待,内部还配备了纳米石墨烯润滑油的油封轴承,使用寿命堪比滚珠轴承。
再细说正面的三把11cm散热风扇,技嘉也是经过精心设计,为了防止相邻风扇之间的扰流现象,中间风扇位采用顺时针旋转,两边风扇则为逆时针旋转。甚至扇叶之间还做了3道导流槽,可以起到增加风压,提高聚风效果的作用。
显卡背面则加装了全尺寸金属背板,并在显卡顶部采用了L形转角设计,大幅增加显卡刚性,长期使用抗变形能力更强。
为了进一步加强显卡的散热,技嘉甚至在背板的右边做了开孔,配合技嘉RTX 4080 魔鹰 16G显卡最右侧的风扇可以使冷风直接吹透显卡,起到优化机箱内部风道的效果。
视线一路向下,一整排的散热鳍片横贯整张显卡,不得不说这个散热配置相当唬人,加上原有的三风扇散热系统,它的散热效能着实让我相当好奇。
切换视角,顶部显眼的设计有两处,一处是巨大的GeForce RTX字符,与背部相得益彰。配合硕大的散热鳍片,远远望去,不仅颜值在线,还给人一种旗舰显卡才有的精致感。
而另一处设计则是技嘉在右下方做了一个镂空 Logo 字符的GIGABYTE字样,它在上机后可以亮灯,支持 1670 万色的 RGB 灯效,并且你也可以在官方或第三方灯光控制程序中选择灯光效果。
在供电方面,该显卡采用了RTX 40系特有的12+4Pin辅助供电设计。单口即可提供高达600W的供电能力,为显卡注入澎湃动力。
电源接口的旁边还有一个一键切换BIOS的按钮。显卡拥有双BIOS模式,分为OC或是SILENT,两个BIOS采用相同的频率,只是OC模式风扇转速会更高一些,SILENT则是更为静音一些。
再从侧面望去,不得不说高端显卡的厚度也是相当惊人,已经接近4槽厚了。玩家在选择机箱时一定要注意它的长度与厚度才行。
接口上,技嘉RTX 4080 魔鹰 16G配备了3个HDMI 2.1a和1个DP 1.4a,依旧支持多联屏以及最高8K 60Hz的输出显示,日常使用肯定妥妥足够了。
拆解显卡
拆开看细节!卸下技嘉RTX 4080 魔鹰 16G背板的螺丝即可分离PCB与整套散热系统。
当你第一眼见到PCB时,你就知道什么叫短小精悍。虽然技嘉RTX 4080 魔鹰 16G的长度来到了34cm,不过大部分都是为了背板上的镂空窗口预留位置。
PCB采用的是类公版的方案,越肩设计,比一般的显卡都要再高一些,不过PCB上的接口、供电、核心、显存,以及辅助供电位置都相当的合理且规正,有大厂出品的质感。
PCB的背板相比正面更为简洁,元器件更少,核心背部电容位置使用了两个POSCAP(导电聚合物钽电容),电气性能更强一些。
PCB正中央的AD103-300-A1核心便是此次的主角,采用TSMC 4N工艺制造,拥有9728个CUDA 核心,性能表现更是直接碾压前代卡皇RTX 3090 Ti。
核心的四周是8颗GDDR6X显存,由美光与NVIDIA联合研制,型号为2PU47 D8BZF,单颗显存容量2GB,8颗组成16GB,显存位宽为256Bit,速度达到了22.4Gbps。
AD103核心妥妥的旗舰级核心,想要带动它,供电系统也要高规格。技嘉RTX 4080 魔鹰 16G配备了18+3相供电,其中GPU核心供电为18相,显存供电为3相。
每相供电都采用了独立的DrMos芯片,封装型号为BLN0,实际应为AOS的AOZ5311NQI,持续输出电流为55A。
供电控制芯片采用了三颗,分布在PCB的正反面,分别是:uP9512U、uP9521R,以及uS5650Q。其中uP9512U与uP9521Q共同管理核心供电,可以做精细化的供电管理。
而面积最小的uS5650Q则担任电压/电流/功耗监控的工作。
供电规模的强悍还需要有个接入口,技嘉RTX 4080 魔鹰 16G采用了最新的12VHPWR接口,单口供电能力可达600W,带动这款性能强悍的旗舰显卡完全没有问题。
当然,上面提及芯片,PCB上还有众多不可或缺的芯片,例如在核心周围还能看到两颗BIOS控制芯片,型号为IS25WP016,分别控制这款显卡的OC BIOS与SILENT BIOS。
我们继续拆解它的散热系统,一下就可以看到技嘉RTX 4080 魔鹰 16G风之力散热系统的高规配置,正面是超大面积的VC均热板,它能够迅速吸收GPU产生的热量,并将热量迅速均匀传递到热管,让AD103核心时刻保持冷静。
同时显存、电感、Mos管处还有高系数的导热垫填充硬件与均热板间的空隙,有助于高效导热。GPU核心也是抹上了厚厚的一层硅脂,毕竟压制的可是次旗舰定位的AD103核心。
散热器为两段式设计,右侧可以看到加厚加高的镀镍散热鳍片模组,大大提升鳍片散热面积和导热能力,轻松应付严苛的散热挑战。
散热鳍片之下是11热管豪华阵列,采用精密的无损内嵌焊接工艺,其中有两根还进行了回弯设计,共计形成了等效9根热管的效果。
最后就是主动散热了,三个支持3D智能启停技术、正逆转设计的110mm导流风扇坐镇,为显卡带来非常显著的散热效率。
再搭配11根复合式热管、大面积散热鳍片以及进气格栅等设计,整个风之力散热系统能够为显卡内部带来足够高效的散热能力。
测试平台介绍
本次测试,我们使用的是技嘉RTX 4080 魔鹰 16G显卡,与之搭配的硬件自然也是天花板级别的配置,CPU用的是最新的IntelCore i9-13900KS,技嘉的Z790 MASTER主板搭配2根16GB DDR5-6000高频内存,散热更是顶级360一体式水冷,这套配置可以说是不存在瓶颈了,能充分发挥出技嘉RTX 4080 魔鹰 16G显卡的真正实力。
游戏性能实测
欣赏完强势的硬件,就该进入实际验证环节了。就在前几天,《赛博朋克2077》这款发售了3年的游戏迎来了史诗级的更新,不仅带来了全新的DLC《往日之影》,还成为首款支持DLSS 3.5的游戏,配合之前就有的全景光追模式(RTX Path Tracing Overdrive Mode),尽享更加逼真更具沉浸感的视觉效果。
那么如何开启DLSS 3.5呢?在新版本的设置界面,最上方的快速预设方案选择光线追踪:超速模式(全景光线追踪模式)。此时,下方DLSS板块除了我们熟悉的DLSS 3帧生成和 DLSS 2的超分辨率外,还新增了DLSS光线重建。顺便提一嘴,这个选项只有在光线追踪:超速模式(全景光线追踪模式)下才会出现。
看过我们之前评测的也知道,这个全景光线追踪模式对硬件性能要求可不低,因此你想要体验完整的DLSS 3.5,建议你还是选择目前顶级的RTX 40系显卡。
不看广告看疗效,下面我们就实际看看这个DLSS 3.5光线重建的效果,打开光线重建后,地面上的倒影比关闭时拥有了更多的细节,建筑和广告牌上的轮廓十分锐利,文字也清晰可辨。在带有反射的场景里面,光线重建都能带来非常惊艳的效果。
此外,光线重建还可以让光路更符合真实世界和我们的直觉。从下面这张图我们可以看出,关闭光线重建前车灯会无条件照亮前方的所有区域。而开启光线重建后光线则会正确地避开有遮挡的区域,更加栩栩如生。像空调外机、垃圾桶背后的阴影,在光线重构后都能很好的体现。
这一组也能很好的看出,车灯照射的位置在车的前方,左右两侧是没有光线的,因此视觉上会更暗一些,开启了光线重建后,确实如此。而没有光线重建的两组则会更明亮一些,不太符合观感。细看远处的霓虹灯,在经过光线重建后,其散发的霓虹灯影也能清楚的印在地面,未开启的两组就稍显逊色了许多。
在有光影的地方会更加明显,像下图一样,开启光线重建后,护栏的倒影能够很好的印在背后的红墙上,更符合实际观感。如果是以前的光追,则无法做到这个效果。并且后方楼宇的墙在光线重建技术下,会更贴合实际,光线照射不到的地方则会变暗,另外两者则是一直保持照亮的状态,不太符合现实。
光线重建技术所带来的视觉效果是惊艳的,相比原来的光追技术,可以说是划时代的改变,不过光线重建技术目前只能在全景光追模式下运行,而这个全景光追模式对GPU算力有极大需求,毕竟实时渲染压力极大,要知道即使强如RTX 4090显卡,不开启DLSS的情况下,4K画质+全景光追仅有可怜的十几帧,因此想要流畅体验还是离不开老黄在RTX 40系显卡上主推的DLSS 3黑科技——帧生成。
这里我们也录制了原生4K以及DLSS 3.5的四档画面在ICAT中进行画质对比。实测下来,不得不说老黄的DLSS 真的有点东西,即使开启帧生成后,画面是用低分辨率超分渲染至4K的,但观感上与原生4K几乎没有任何差距,无论是水面反射还是建筑纹理全都清晰、锐利。
不过这里还是要提一下,帧生成功能需要依赖RTX 40系显卡中第四代Tensor Cores最新引入的光流加速器(New Optical Flow Accelerator),它可以在DLSS 2的基础上,计算两个连续帧内的光流场,捕捉游戏画面从第1帧到第2帧的方向和速度,并且获取其中粒子、反射和光照等像素信息,最后分别计算运动矢量和光流以获得精准的阴影重建效果。这也是帧生成功能为RTX 40系显卡独享的原因所在。而DLSS 3.5的光线重建技术更像是一个AI模型,不依赖专属的硬件支持,因此所有支持光线追踪的RTX显卡均可使用。
说了那么多,应该有玩家已经开始好奇,DLSS 3.5加持后,游戏性能究竟怎样?首先让我们先看看,不开启DLSS的情况下,这张RTX 4080能否抗住全景光追模式超高的计算量。实测,1080P下仅有56 FPS,2K或4K就更不用多说了,完全不能流畅运行,甚至是RTX 4090来了,也无法在2K下顶住全景光追这种”怪兽级“的画质。
如果你开启了DLSS 3,那全景光追模式就能轻松驾驭了,技嘉RTX 4080 魔鹰 16G在DLSS 3平衡档下,4K分辨率也有64 FPS以上的成绩,丝滑流畅游玩夜之城肯定是不成问题的,如果切换至2K分辨率,那直接就是高刷体验!
如果我们进一步开启 DLSS 3.5 后,帧数则进一步提升至68 FPS,不论是画质还是流畅度均非常出色。并且开启 NVIDIA Reflex 技术的话,延迟也会缩小 5 ms 左右,此时游戏手感更佳。
我们也对比了一下DLSS 3与DLSS 3.5下,游戏性能的差距,在光线重建技术加持下,技嘉RTX 4080 魔鹰 16G显卡的性能不降反升。看来老黄的新技术确实有点东西,不仅画质更好的同时,还能进一步降低显卡性能的开销,从而达到更高的帧数,甚至延迟也有降低,游戏体验更丝滑。
当然此时应该有用旧显卡的玩家好奇,那DLSS 2能否开启光线重建呢?这里我们也用RTX 40系显卡进行了尝试,首先看纯DLSS 2的性能表现,技嘉RTX 4080 魔鹰 16G在1080P或2K下都能流畅运行,4K下就有些力不从心了,高分辨率游戏还是得看DLSS 3才行。
开启了光线重建后,三个分辨率的帧数均有上升,如果跟关闭全部DLSS功能作对比的话,那提升就更大了,特别考虑到《赛博朋克2077:往日之影》的全景光追模式对显卡压力巨大的情况下更是如此。所以说,即便你是老显卡用户也不用担心,DLSS 3.5确实能够带给你新的游戏体验,不过,如果你想体验极致的画质,那RTX 40系显卡会更适合你。
总结
总的来说,这次DLSS 3.5带来的光线重建还是很有意义的:它不仅提升了画面的质量,也能带来更流畅的帧率。而且它还可以在RTX 20和30系显卡上启用,这对老显卡用户绝对是一大利好。
不过目前这项技术只能在全景光追模式下运行,这也是其目前最大的限制,当各种游戏或低预设下都能开启光线重建技术时,这才是真正的”大杀器“!
说回测试环节,我们这回测试所使用的是技嘉RTX 4080 魔鹰 16G,不得不佩服RTX 40系显卡的性能,这款显卡在实际表现中相当出彩。
开启DLSS 3.5后,即使是4K分辨率下,也有丝滑流畅的游戏体验,并且在1%Low帧上也相当出众,保证了游戏的稳定性,NVIDIA Reflex的加持下,输入延迟亦有可观的表现。
DLSS 3.5的出现,让RTX 40系显卡再上一个台阶,帧数保障的同时,画质、流畅度等都给玩家带来了全新体验。
当然,如此优越的技术也不仅仅可以用在游戏中,NVIDIA也表示,除了《赛博朋克2077:往日之影》之外,未来光线重建技术也将应用在《心灵杀手2》、《传送门RTX版》等游戏和Chaos Vantage、D5渲染器上,最快今年秋季就会与大家见面。
AI的出现,不仅让创作者感受到了科技所带来的卓越进步,现在玩家也能借DLSS感受AI加持的超能力。
从最初的DLSS 1.0,AI超分提升分辨率,到DLSS 3.0用AI进行帧生成,再到现在的DLSS 3.5,AI让光线追踪更精细,似乎AI才是未来科技发展的大趋势,一张出色的显卡就是AI领域绝佳的敲门砖。
并且不光是游戏领域有AI助力,创作方面AI的优势就更加明显了,像AI绘画、AI追踪目标、图片视频高清化等应用层出不穷。AI能帮助你提高工作效率,这都是极具实用意义的体现。
当然啦,想要AI能够在游戏领域与创作领域大杀四方,高性能的显卡肯定少不了。像我们手上的这张技嘉RTX 4080 魔鹰 16G,既有绝佳的创作能力,也有强势的AI加持,游戏性能更是当仁不让,届时,配合上老黄出色的DLSS技术,领略全新光追的魅力。
不过RTX 40系显卡能够在AI领域中大放异彩,那还要属老黄的高瞻远瞩。一方面是因为NVIDIA占据了绝大部分的市场份额,另一方面更是因为NVIDIA早早就在AI市场深耕多年,由上至下地布局通过GPU加速AI的战略。
这一点与如今的CUDA十分相似,超前的部署,让自己的生态得以完善,那玩家自然也会选择你的产品。