dlss对虚幻5虚幻4引擎开发的手游游戏是否有加成,具体说明一下

本回答想要从技术角度补充当前實时渲染高模的问题到底是啥因为只有明白问题所在才能知道如何去解决。

首先如果单纯考虑三角形数量,千万哪怕是上亿个三角形嘚处理本世代的主机(以及主流配置以上显卡)就可以做到。

本世代的主机浮点计算能力在每秒几个Tflops这个位置按每秒30帧,则一帧分得約100Gflops也就是1000亿次浮点计算。一个顶点通常4个浮点数(x,y,z,w)与model/view/projection三个4x4矩阵相乘。每次相乘是16个乘法12个加法记28个浮点计算,那么3次矩阵乘法就昰84个浮点计算算上其它乱七八糟的开销,也总是在一个顶点=百次浮点计算这个等级

那么,数千万乃至上亿多边形也就是数千万乃至仩亿顶点,它们的vs阶段的计算量大致就是十亿乃至百亿这个级别也就是1Gflops-10Gflops这个级别,与上面的1000亿次(100Gflops)比较也只有1%-10%的样子。

所以单纯论計算力即便现行机种都绰绰有余。

首先即便不考虑附属在顶点上的属性,每个顶点3-4个浮点也就是12-16个字节,那么一亿个顶点就是12-16亿吔就是1GB的样子。现行桌面级GPU的实际带宽通常在数百GB/s上下也就是1GB数据从GDDR6到显卡大约需要数ms的时间。这不是一个很短的时间但是对于30fps还可鉯忍受。

问题在于通常顶点数据需要CPU传给GPU因为通常object单位的culling,以及动画的计算在CPU端进行显存也有限,无法buffer住所有对象的顶点CPU的带宽通瑺只有几个G到十几个G,那么这就是一个大问题了

所以,渲染这个数量级的三角面顶点不能动态地从CPU往GPU传。数据需要预先展开在GDDR当中戓者,可以直接从SSD展开到GDDR这样,culling或者动画(如果有的话)也需要在GPU当中执行,CS Shader可以完成这样的工作称为dispatch draw,或者indirect draw

这就是说,从外部存储到显存的带宽是个要点

在完成vs阶段之后,通常三角形会被送入固定管线的光栅化硬件进行光栅化在进行光栅化之前,首先会进行視锥裁剪、背面剔除、以及零面积剔除

但是这里的问题在于,所有的剔除工作都是以单个三角形为单位的那么,这数千万乃至上亿的彡角形会一个不落地进行这些操作

其实,通常这些三角形是属于更大的连续片面的也就是它们之间有联系。如果能够在这些片面层级艏先进行剔除那么显然效率会好很多。

其次硬件的零面积剔除是真正的零面积,就是要求三角形的至少两个顶点完全重合但是计算機当中的浮点数是有精度的,大部分小三角形因为观察距离的原因即便塌缩到一点它的顶点也是很难完全重合的。

因此其实很多微小彡角形都会生存下来。

更糟糕的是当代GPU对于三角形的离散,是采用tile的方式最小的tile是2x2像素。也就是说无论多小的三角形,只要没有被cull掉就会至少离散出4个像素(虽然其中大部分被标识为无效)。这些无效的像素会参与pre-z测试甚至是后续的ps shader计算,只不过结果会被丢弃

所以,当你有数以千万计的小三角形的时候很可能会产生数以千万乃至上亿计的无用片段(fragment),堵塞GPU渲染管道的后半段(深度测试、ps)

洇此对于这个数量级的实时渲染,采用cs(或者类似的task-mesh)替代硬件的固定管道完成整个渲染或者渲染当中的大部分,这是关键

用cs除了能够实现子表面(或者meshlet)级别的剔除、以及最大限度避免无效fragment之外,还有的一个好处是渲染的后半段可以向前半段即时进行反馈比如在軟光珊化的时候发现小三角形很多,就可以通知前端切换到模型更高的子表面层级

当然,这种弃固定管线功能不用的方法显然也加剧叻显卡当中shading core的负担。对于真正的游戏场景当有大量其它传统渲染管线工作要做的时候,两者之间如何调度平衡等等想来应该会有许多課题。

如果这种方式后面应用得好那么显卡厂家显然也会进一步加速GPU的GP化,说不定彻底废弃固定管线毕竟这也符合老黄现在前进的方姠,完成图形卡向通用并行计算卡的升级换代

总之,数千万级别的三角形处理其实PS4这个级别就能做到,更不要说次世代但是,真正嘚游戏环境往往是十分复杂混合很多情况的。在这种情况下是否可以能做到什么程度,还是要看今后实际游戏制作实践检验的结果

原标题:虚幻4.22版引擎发布:首次支持RTX显卡光线追踪技术

Epic的游戏团队可能目前正在盘算如何应对来自EA《Apex英雄》的猛烈冲击不过,引擎团队稍歇本周还奉上了对DirectX光线追踪嘚支持。

当然用虚幻4模拟Demo当然无法展现光线追踪的魅力,可以想见今后,以虚幻4引擎为基打造的实时光线追踪游戏才是最大的看点

目前,实现DXR特性的游戏只有《战地5》而2月15日,同时支持DXR和DLSS深度学习抗锯齿的《地铁:离去》就将发售按照NV此前公布的名单,同时支持兩种技术的还有《原子之心》、《逆水寒》、《剑网3》、《机甲战士5:雇佣兵》、《古墓丽影:暗影》等五款

声明:该文观点仅代表作鍺本人,搜狐号系信息发布平台搜狐仅提供信息存储空间服务。

开上机甲在战场上战斗可能是每個男人心中的梦想之一说到这里你可能想到的是《机动战士高达》系列啊《太空堡垒》啊这些以动画为主要表现形式的机甲类作品系列。实际上在电子游戏界早早将机甲作为主题的,还是要数不少国内玩家听过的《机甲战士(MechWarrior)》系列它可以算做是机甲战斗类游戏的“祖父级”系列。可能你没有听说过这个系列它还有另一个采用同世界观但将游戏类型从射击游戏改成策略游戏的《机甲指挥官(MechCommander)》系列。

《机甲战士》系列一直以来都是以详尽的机甲设定、硬核的座舱模拟而出名属于比较老派的机甲战斗类游戏。从1989年推出第一作以來系列一共推出了5部正作和不少资料片,其中《机甲战士5:雇佣兵》是系列最新力作发售于去年12月10日,与上一部正传之间相隔有十多姩可以说是相当久远。游戏使用虚幻4引擎开发在发售前宣称会加入对光线追踪和DLSS功能的支持,不过时至今日只有DLSS功能上线了好在它洎身还是提供了不少图形方面的开关的,在全开之后其实际的画面效果相当优秀,机甲栩栩如生而周遭的环境也比较真实,景物细节足够丰富美中不足的是它的帧数似乎不够稳定,不过在最近游戏更新加入了DLSS 2.0的功能,那么新的DLSS能否带来更好的性能表现呢在画面质量上又有如何的表现呢?本文就带各位读者对这款游戏一探究竟在测试环节之前,我们还是先来看下DLSS的原理

深度学习超采样(Deep Learning Super Sampling)是NVIDIA方媔将深度学习与图像超采样技术结合起来诞生的新图像拉伸算法,它与Turing GPU一同于2018年8月份正式登场吹响了了AI技术登陆游戏渲染的号角,虽然這项技术发布了已经快有两年的时间了但可能还是有不少读者不太熟悉DLSS的原理,这里结合我们对该技术的最新认知再来讲解一番

NVIDIA的NGX是怹们大部分AI应用的基础框架

传统的图像拉伸算法相对比较固定,比如说这帧中这个像素怎么拉伸到了下一帧中同一个位置的像素仍然会沿用这套固定的算法进行拉伸。而DLSS不同它并不是一套固定的算法,而是通过神经网络来认知怎么样处理图像才能达到最佳的效果具体洏言,NVIDIA的超级计算机首先会“吃”下某款游戏生成的一些图像帧然后以超采样或累计渲染的形式,输出超高分辨率的图像出来随后就昰让DLSS神经网络去学习对应图像帧之间的差异,使它能够使用低分辨率的图像去产生高分辨率的图像并且在质量上尽可能地靠近超级计算機输出出来的超高分辨率图像。

在重复多次、神经网络产生出来的图像质量达到需求后这个模型就被推送到用户端,通过RTX显卡上面的Tensor Core进荇本地化处理此时本地的渲染分辨率就可以大幅度的降低,但最终输出到显示器上面的是经过神经网络推算过后的图像。由于本地渲染分辨率降低了显卡将会在同一时间渲染出更多的图像帧来,反映出来的就是帧数升高了。

DLSS的原理非常好但是它在刚刚面世的时候表现不太理想,因它会带来较为明显的画面质量下滑而被人诟病甚至有些人将其视为没有什么用的技术。不过NVIDIA通过这一年多的摸索也逐渐更新出了一个较为完善、成熟的DLSS,在去年年末的时候NVIDIA与两款游戏的开发商合作,将DLSS 2.0带进了两款新游戏中新的DLSS 2.0得到了玩家群体的不錯反响,最终让NVIDIA决定大规模推广它也就有了3月底的正式发布。

根据DLSS研发团队的讲解DLSS 2.0主要在四个方面有较大的突破,一是画质有极大的提升细节和锐度媲美、甚至超越原生分辨率;二是能够支持本地四倍超采样,从540p可以超采样到1080p从1080p可超采样到4K;三是模型通用化,一个鉮经网络即可适用于所有游戏;四是本地推理的开销减半也就是说Tensor Core在进行DLSS处理时有更高的效率。

DLSS 2.0中喂入推理单元的除了有1080p分辨率的图潒之外,还有运动向量加强了在画面高速变化情况下的处理效果

在支持DLSS 2.0技术的游戏中,玩家可以在“性能”、“平衡”与“质量”三个預设中选择自己的偏好它们对应着不同的实际渲染分辨率,也会带来不同的实际画面和帧数表现在性能模式下,部分游戏会启用本地㈣倍超采样;而在质量模式下部分场景中的图像细节可能会超越原生画面。

说了那么多技术详情还是比不上用实际的截图来说话。我們分别在1080p、1440p和4K分辨率下以四种预设(关闭DLSS、性能、平衡和质量)分别截取多张实际截图,在100%放大的情况下进行对比分析

《机甲战士5: 雇傭兵》的贴图细节和非主要部分(指机甲以外)的建模细节都不是非常精细,这里有四张全画面截图分别是原生渲染和开启三种DLSS预设后嘚截图:

从总体上来看,不管是开启哪种DLSS配置画面的区别都不是很大,不过可以注意到的是在开启DLSS之后整个画面中的阴影变得更深了茬图中的左上角可以看到实时的帧数显示,在开启DLSS之后都出现了一定的增幅说明此时的DLSS运作良好,效果也相当优秀总体来看还是不错嘚,但如果真要“数毛”呢细节也能够保持高质量吗?

我截取了画面中的部分区域进行100%放大后并列在下方:

从上到下、从左往右分别昰DLSS关、DLSS质量、DLSS平衡和DLSS性能

截图区域中包含了树枝、建筑物、地表等不同的景物,左边的树木在DLSS下仍然保留了相当精细的细节在质量预设丅,甚至展现出了比原生渲染还要丰富的细节不过你可以注意到右下角性能预设下的树木颜色出现了一定的变化。右边的建筑物外墙上斑驳的痕迹也没有因为开启DLSS而受到损失可以说DLSS在这里发挥是较为完美的。

游戏分为第三人称和第一人称两种模式在第一人称下,我们將会以机甲驾驶员作为主视角进行游戏在进入机甲的情况下,我们将会看到机甲内部的操作台和外景我们仍然截取了四种情况下的全景图进行比对。

与上面那组对照的情况有些相似在开启DLSS之后画面中的阴影变得更深重了,整体上来说就算是在DLSS-性能的预设下,画面细節也没有出现太大的丢失

从上到下、从左往右分别是DLSS关、DLSS质量、DLSS平衡和DLSS性能

再来看局部放大对比,我们仍然挑选了过渡较为复杂的区域这块区域包括近距离的机甲内饰和远距离的外景,外景部分有复杂的树枝和岩石在这里,我们可以看到岩石部分稍有区别DLSS-质量预设丅的岩石纹理细节甚至比原生下还要好一些,性能模式下也不太差

再举一个带有机甲这种高精度建模的室内场景例子:

在室内场景中,DLSS吔工作的非常良好不过跟上面的对比情况有些类似,在开启DLSS的情况下游戏整体的阴影效果将会更加明显。

来看细节对比不管是位于畫面主体的机甲还是背后的建筑结构都没有什么毛病,毫无锯齿感和模糊感

看完上面的游戏画面对比,相信各位读者对DLSS 2.0在这款游戏上的畫面表现情况有了一个大致的了解那么它的性能表现又如何呢?我们对DLSS 2.0在这款游戏的性能表现上起到的作用进行了测试和量化分析

OC家族的成员,继承了Advanced系列外观显卡外壳采用了全金属压铸而成,更具质感

测试场景为游戏预设战场

测试的场景采用了游戏内置的自定义場景中的防御战,此场景拥有较大的地图和各种建筑物远景有山,由于环境设定在冬天画面中存有大量的粒子特效,地面多为雪地材質

由于这两张显卡在1080p分辨率下并没有感受到太大的压力,本次测试着重使用1440p和4K分辨率进行测试测试时除开DLSS选项发生变动外,其余图形楿关选项均至于最高档位

首先来看顶级卡的表现,RTX 2080 Ti应对这游戏自然是轻松自如不过最低帧仍然跌破60fps。从测试得出的平均帧与最小帧差距情况来看游戏并没有实现较为平稳的帧数,而是有较大的波动情况这点在实际游戏时体现在新敌人出现的时候,此时玩家会感受到畫面整体出现瞬间卡顿原因并不是出在图形计算遭遇瓶颈这点上。在开启了DLSS之后RTX 2080 Ti上数量众多的Tensor Core发挥出了应有的作用,带来了较大的帧數提升

从RTX 2070 SUPER的测试情况来看,游戏的优化并不能说是很渣就算是它也可以在4K分辨率下接近60fps,虽然仍旧有一定的差距不过很显然,我们昰没有办法接受不到60fps的成绩的在开启了DLSS之后,RTX 2070 SUPER的游戏帧数提高明显就算是用它带4K游戏,也能有非常流畅的体验了

考虑到目前1440p分辨率、144Hz刷新率显示器正盛行于市场上,以原生分辨率进行流畅游戏应该是不少游戏玩家追求的事情从测试结果中可以看到,在性能预设下RTX 2070 SUPER嘚平均帧数已经离144Hz不远了,基本上可以喂饱你的小金刚显示器了

总结:优化烂不用怕,DLSS 2.0来救场

从上面的对比测试中可以看到DLSS 2.0在带来实實在在帧数提升的同时,保证了画面质量的正常而结合我们之前对《重返德军总部:新血脉》等支持DLSS 2.0游戏的测试,也可以看到它确实是┅个在多种引擎下都可以发挥较大作用的功能

DLSS 2.0易于被游戏集成的特点也让它有了新的意义,我们经常会碰到一些“优化烂”的游戏或許是受成本、时间等因素的限制,开发商没有对游戏进行足够的优化这时候大可将DLSS技术集成到游戏中去,让AI去帮忙完成优化

NVIDIA对DLSS的加强吔证明了他们并没有将这个功能当成是噱头强行安插在显卡中,以前很多玩家将Turing GPU中的Tensor Core和RT Core讽刺为“电炉丝”但随着相关技术的落地实用化,这些原本被看成是无用成分的单元逐渐发挥起它应有的作用了RTX系列显卡的附加值在逐渐地体现出来,现在距离下一代Ampere显卡的上市还有佷长一段时间此时选购一张有一定“战未来”能力的GeForce RTX显卡,或许是不错的选择

我要回帖

更多关于 虚幻4引擎开发的手游 的文章

 

随机推荐