登录

创意创作加速的再次飞跃:GeForce RTX 3080 Studio创作性能体验


速读:从安培GPU核心架构技术解析来看,可以明显看到RTX30系显卡的GPU在3D渲染性能上相比图灵架构GPU性能有了明显的增长,必然会给3D渲染、AI加速的工作流程以及视频编辑、流传输等创意创作应用提供能量加速。 ●用于光线追踪运动模糊的新硬件加速。 同样,在支持实时光线追踪渲染的软件应用中,开启DLSS之后,同样能让渲染输出速度得到极大的加强,比如最新的D5渲染器就是很好的例子。 生成的图像准确地表达出了物体的速度,并提供了出色的渲染输出质量。 对比三者在运动模糊处理上所花的时间,RTX3080使用约61秒,占总渲染时间的16%左右,RTX2080SUPER使用了约312秒,占总渲染时间的35%上下,二者对比也可以看出RTX3080相比RTX2080SUPER在处理运动模糊效果时,拥有更高的效率。
微型计算机 发布时间:09-21 10:31 《微型计算机》杂志官方帐号

2019年,NVIDIA正式提出了RTX Studio计划。其最大的特点在于,除了拥有传统的GPU加速技术和效能外,还凭借英伟达图灵架构GPU在光线追踪、AI计算方面的优势,在大量的应用中显著提升处理速度。在NVIDIA看来,一个完整的RTX Studio生态包含三个部分,分别是RTX Studio硬件设备、Studio驱动程序以及支持NVIDIA Studio加速的应用,旨在为越来越多地依靠PC来满足他们的工作和激情的在线创作者和自由职业者提供专用的高性能笔记本电脑、台式机和GPU。在过去的一年中,NVIDIA与OEM和ISV合作伙伴合作,推出了近百款Studio笔记本电脑和台式机,以及50多个针对RTX GPU优化的创意和设计应用程序。这些GPU加速的PC和应用程序使超过4,500万专业人士和专业消费者的创意作品能够在创纪录的时间内创作出自己的作品。

▲RTX Studio专为创作者设计。

▲包括光线追踪、AI加速和视频直播等应用在内,RTX Studio的设备都有更为出色的使用体验。

如今的RTX Studio生态,涉及RTX Studio硬件、支持RTX加速的创作应用、Studio驱动程序三个重要的部分。RTX Studio硬件是通过了NVIDIA认证标准的笔记本电脑、台式机电脑,支持RTX加速的创作应用,为第三方软件利用RTX GPU的特性,来加强创作功能。Studio驱动,则是NVIDIA区别于为游戏优化的Game Ready驱动,而针对创作应用的工作流有性能加成的GPU驱动,并跟随创作应用的更新,提供稳定性的全面持续优化支持。

NVIDIA显然对RTX Studio寄予了厚望,而且正在围绕它打造一个大的生态圈,所以我们毫不怀疑,随着GeForce RTX 30系显卡的上市,RTX Studio必然会是与游戏性能并列的核心重点。因此,我们特别想知道,相对于上一代表现已经不俗的RTX 20系显卡来说,新的RTX 30在Studio创作性能上,又有了怎样的变化?

RTX 30:创意创作加速再次飞跃

随着NVIDIA GeForce RTX 30系显卡的发布,创意创作世界也许即将迎来继图灵引导的RTX Studio应用之后的第二个春天。从安培GPU核心架构技术解析来看,可以明显看到RTX 30系显卡的GPU在3D渲染性能上相比图灵架构GPU性能有了明显的增长,必然会给3D渲染、AI加速的工作流程以及视频编辑、流传输等创意创作应用提供能量加速。

相比RTX 20系显卡的GPU,GeForce RTX 30系列GPU具有加速渲染的新功能,其中主要的核心特色包括:

●第二代RT Core,也就是第二代光追核心。在目前市面上的诸多顶级渲染器(包括Blender Cycles、Chaos V-Ray和Autodesk Arnold等)中能够提供高达2倍的性能提升。

●用于光线追踪运动模糊的新硬件加速。这是3D设计创作渲染中常用的技术,在RTX 30系显卡中运动模糊的渲染性能有可能提高达8倍之多。

●GDDR6X显存。目前得知RTX 30系列GPU最多可提供24GB的GDDR6X显存(已知的显卡型号为GeForce RTX 3090),在海量显存的辅助下,对于那些需要处理复杂的3D项目和多应用程序的工作流而言,有着巨大的性能提升幅度。

●NVIDIA DLSS。DLSS大家都不陌生,这种基于AI的超分辨率及游戏加速实现技术,能够在很大程度上提高实时光线追踪可视化应用程序中的帧速率,比如玩家们都非常熟悉的光追游戏中,开启光追效果之后必然会导致帧率的严重下降,但是再开启DLSS之后,帧率的下降就能得到有效的遏制,而且画质表现还更为优秀。同样,在支持实时光线追踪渲染的软件应用中,开启DLSS之后,同样能让渲染输出速度得到极大的加强,比如最新的D5渲染器就是很好的例子。

●第三代Tensor Core张量核心。RTX 30系显卡带来的第三代张量核心,带来了更强的可加速节省时间的AI工作流,比如在新的Blender、V-Ray和Autodesk Arnold等3D渲染器中的交互式视降噪功能,或者是在Davinci Resolve中的视频超高分辨率解析、回放或输出等。

●视频编辑利器。GeForce RTX 30系列GPU已针对需求极高的视频工作流进行了优化。新功能包括:

支持PCIe 4.0: 相比PCIe 3.0,PCIe 4.0的整体带宽有了跳跃式的激增,这使得GPU与PC其余部分之间的通信连接速度呈翻倍式增长,无疑这对于大型超高分辨率HDR和RAW视频的剪辑、回放或编码输出的GPU加速过程有着重要的正向意义。

AV1解码器: RTX 30系GPU是首款支持新的AV1编解码器的独立GPU核心,这将使创作者能够以高达8K HDR的速度播放视频,同时使用的带宽减少50%,并极大地减轻了CPU的负担。多达24 GB的显存:老话重提,即使是在最苛刻的8K视频编辑和着色工作流程中使用多种效果时,24GB的GDDR6X显存也足以提供流畅的体验。

当然,除了可加速顶级ISV创意应用程序的第二代RTX GPU外,NVIDIA还为创作者提供了一整套工具和软件,使得创意工作者能够更加随心所欲地进行精彩的创作。比如NVIDIA Broadcast这一新的应用程序,它能使用AI将主播的麦克风和网络摄像头转换为“智能”设备,并具有虚拟背景、网络摄像头自动边框和麦克风降噪等新颖功能。在例如NVIDIA Omniverse Machinima,它可以使创作者能够从受支持的游戏和第三方素材库中导入素材,然后使用基于NVIDIA AI的算法和新的Audio2Face技术自动为角色设置动画,从而创建基于CG的精彩游戏故事。当然,对于创作者们来说,还有一个必不可少的就是Studio Driver和相关SDK,相信在这些的加持下,RTX 30系GPU能发挥出更为强劲的创作性能。

实测RTX 30创作加速,令人惊喜的效率、性能双提升

说了这么多,那么RTX 3080在创作性能上到底有怎样的提升?能够给创意创作工作者带来哪些不一样的体验?咱们只能手底下见真章,实际来测试看看吧。

测试平台

显卡:NVIDIA GeForce RTX 3080 FE、GeForce RTX 2080 SUPER FE

处理器:Intel酷睿i9-10900K

主板:ROG Strix Z490-A GAMING

内存:芝奇幻光战戟 DDR4 3600 16GB×2(双通道)

电源:ROG玩家国度THOR雷神1200P

显示器:戴尔UP3218K(7680×4320@60Hz)

Blender Cycles

作为极具知名度的免费和开源3D创建套件,Blender支持3D建模、动画、模拟、渲染、合成、运动跟踪、视频编辑以及2D动画设计等创意创作设计。NVIDIA Optix加速渲染可用于加速最终帧渲染以及直接在Blender设计窗口中进行交互式光线追踪渲染,从而为创作者提供有关模型或场景元素更改如何直接影响最终输出效果的实时反馈,而无须执行测试渲染以查看最终的材质、灯光、阴影等。

Blender cycles现在可以支持运动模糊渲染,而RTX 30系显卡现在也能支持硬件加速的运动模糊,从而使RTX 30系GPU在渲染过程中可以显著加快运动模糊的渲染过程。运动模糊可以由渲染引擎在渲染过程中计算,也可以作为后处理效果添加到非运动模糊帧或一系列帧中。

在渲染过程中计算运动模糊会产生异常高质量的结果,但是由于额外的计算,传统上它也会大大延长渲染时间。在传统上,业界通常将“矢量模糊”作为近似运动模糊的后处理步骤来实现,这可以加快渲染速度,但会引入不必要的视觉伪影,从而影响最终图像质量。通过在最新的RTX 30系GPU上引入的加速运动模糊,创意创作者则可以利用渲染的运动模糊提供的更高质量,而对渲染时间的影响较小。

▲无运动模糊渲染,整个场景看起来是静态的,对于运动的轨迹需要我们脑补想象。

▲采用传统矢量模糊渲染模拟运动模糊,但可以发现在最终渲染中产生了不需要的瑕疵部分。可以看到在图中红框处标示的黄色带上,以及在反射介面的地板上所看到的不自然的影像渲染结果。

▲在Blender中使用RTX GPU加速运动模糊渲染,我们既可以得到高质量的运动模糊图像,又不会在图像中产生伪影。生成的图像准确地表达出了物体的速度,并提供了出色的渲染输出质量。

在Blender的测试中,我们使用了NVIDIA提供的4K CG渲染模型进行测试。首先在Blender中测试开启运动模糊渲染与关闭运动模糊渲染在画质表现的差距,同时加入RTX 2080 SUPER和酷睿i9-10900K作为对比,来测试RTX 3080在创作性能上的表现。其次,我们也使用了Blender官网提供的Benchmark——Blender Open Data在不同模型场景下测试了RTX 3080、RTX 3080 SUPER和酷睿i9-10900K的渲染性能表现。

测试结果清晰地表明,这一代的RTX 3080在渲染性能上相比RTX 2080 SUPER提升了2~3倍,而相比目前的顶级处理器酷睿i9-10900K而言,性能更是提升了10倍左右。

对比三者在运动模糊处理上所花的时间,RTX 3080使用约61秒,占总渲染时间的16%左右,RTX 2080 SUPER使用了约312秒,占总渲染时间的35%上下,二者对比也可以看出RTX 3080相比RTX 2080 SUPER在处理运动模糊效果时,拥有更高的效率。

在Blender Open Data Benchmark的六个渲染场景测试中,RTX 3080仍然表现出了相对于RTX 2080 SUPER约翻倍性能的提升,而酷睿i9-10900K仍然表现得“狼狈不堪”,性能仅为RTX 3080的1/10左右,完全失去了竞争力。所以对于设计创作的渲染加速或视频编解码输出、回放来说,真的没CPU什么事儿了。

D5渲染器专业版

当今的设计行业面临着新的挑战,面对面的交流会议越频率越来越低,此时使用高保真实时创作和交流设计工具的需求比以往任何时候都更为强烈。作为一款国产3D设计渲染器,D5渲染器是一款使用最新的NVIDIA RTX GPU核心技术的,从头开始研发而来的可视化架构设计软件。D5渲染器中使用了大量RTX GPU的核心创作加速技术,包括RTX实时光线追踪、RTX 全局光照以及NVIDIA DLSS等。通过这些RTX GPU的特色技术,在D5 渲染器中设计师们可以最大限度地提高设计的实时交互感、提升设计效率以及真实感。通过RT Core和Tensor Core的加持,D5 Render能够为设计师们提供极富交互性的结果预览和精美的最终渲染效果的可视化过程,非常贴心。也正是如此,D5 Render在设计行业逐渐受到了越来越多的设计师的关注与使用。

在测试中我们使用了一个大小约为3GB,时长约50秒左右的CG模型包。这个模型包中包含了丰富的实时光线追踪渲染效果,通过它,我们可以体验到实时光线追踪在设计中为设计师们带来的卓越体验,并且通过D5 渲染器所支持的DLSS功能,也能准确地测试出DLSS对设计创作行业效率、效果的巨大提升。

▲在Low Quality设置下,渲染过程完全屏蔽光线追踪效果。

▲在Middle Quality设置下,渲染过程启用部分光线追踪效果,可以看到时钟的表现呈现出了一些反射效果以及全局光照下和部分阴影分布效果。

▲在High Quality设置下,渲染过程将启用全部的实时光线追踪效果,我们此时可以看到时钟表现呈现出了极为丰富的反射效果,房间的全局光照效果也特别明显,整体画质提升了一个档次。

▲在DLSS关闭(上2图)的情况下,CG的播放过程中可以看到木柱有一些锯齿存在,而在DLSS开启(下2图)之后,木柱和CG中的物体变得更加清晰、锐利,而且窗外的草丛也更加清晰。

我们最后用一段大约6秒的CG动画模型做了渲染输出,分别在1080p/最高质量和2K/最高质量下输出了两段CG动画。通过测试可以发现,开启DLSS之后,不但渲染输出的时间缩短了一半,而且 CG输出的MP4视频文件在回放时的画面也更加清晰。同时,在与上一代RTX 2080 SUPER显卡对比时,可以看到RTX 3080的CG渲染输出性能相比RTX 2080 SUPER提升了大约一倍。

OctaneRender 2020.1.5 Preview Demo

OctaneRender是一款独立的基于GPU加速的3D设计渲染引擎,在某种程度,你也将其称为渲染器。OctaneRender能够为3D设计创作者提供高质量的渲染输出技术,当然它与NVIDIA的RTX GPU提供的CUDA与RTX加速也是密不可分的。

在2020.1.5版本中,OTOY对OctaneRender进行了一次大的升级,增加了对NVIDIA第二代RTX GPU,也就是对GeForce RTX 30系显卡的加速支持进行了特别优化,具备了超快的RTX加速功能以及自主学习的AI能力优化。目前OctaneRender 2020.1.5已经能够很好地支持绝大部分3D应用程序的模型文件,包括Autodesk MAYA、3DS Max、MAXON Cinema4D、DAZ 3D、Side Effect以及虚幻引擎等。因此我们也能看到近年来,OctaneRender的应用也是越来越普及,并受到了诸多设计师的热捧。

在测试中我们使用的是最新版的OctaneRender 2020.1.5 Preview Demo,这是一个完全免费使用的版本,只是在渲染过程中会有水印存在,但并不影响我们的测试成绩,也不会额外耗费渲染时间。在渲染场景上,我们选择了具有代表意义的哈瓦那(之前OctaneBench中出现过的场景,包含两种光线模式)、上帝之光以及植被这三个场景模型,并在RTX ON和RTX OFF的两种情况下,测试RT Core和Tensor Core对包含丰富光线场景的渲染加速能力。作为对比,我们也同时加入了上一代的RTX 2080 SUPER显卡进行参考。

▲OctaneRender的渲染测试结果以Msamples/sec的形式呈现,也就是表明GPU每秒能处理渲染样本数的能力,越高越好。

测试结果又是惊人的相似。在OctaneRender 2020.1.5 Preview Demo版的测试中,我们选择了四个不同的渲染测试场景,RTX 3080在关闭RTX的情况下相对RTX 2080 SUPER都表现出了近100%的性能提升幅度。而在开启RTX之后,RTX 3080相对于RTX 2080 SUPER则表现出了超过100%的性能提升。而综合成绩来看,仍然与前面三款创作软件的测试结果保持了惊人地相似与一致性——RTX 3080的Studio创作性能相比RTX 2080 SUPER是真的翻倍!

性能翻倍!创作行业迎来新春天

性能真的翻倍!从我们今天所有的测试结果都能清晰地看到,在创意创作性能的比较上,RTX 3080的加速性能已经达到了200% RTX 2080 SUPER的性能,相对于当前的顶级处理器酷睿i7-10900K而言,在部分测试中已经表现出了10倍以上的性能提升。对于这样的测试结果,我们是满意的,至少就预期的性能增幅而言,是要超出预想的。尤其是在游戏性能上,虽然RTX 3080相对于RTX 2080表现出了60%的增幅已经让我们感到满意,但Studio性能上真正翻倍的增长则可以说是叫做惊喜。

记得在之前我们做RTX 20系显卡的Studio创作性能测试时,我们曾说过RTX 20系显卡将带来设计创作行业的春天,而在测试了RTX 3080的创作性能之后,我们觉得可以这样说,RTX 30系显卡将带来创作设计行业的新春天。第二代RT Core、第三代Tensor Core、更强的CUDA核心配置、更高的AI、进化的DLSS……这一切的一切,都说明了NVIDIA已经在RTX 30系显卡上为设计创作的加速铺好了轨道,只要等到所有的设计软件列车接入这条轨道,设计创作行业必将驶向一个全新的春天!

编者注: 当然,还有不少基于创作设计的常用软件,比如3DS Max、SketchUP、MAYA、Premiere Pro、V-Ray、Arnold等,它们都已经支持基于RTX GPU的加速功能,但是限于篇幅,我们今天就不一一测试了。不过好在RTX 30系显卡才刚刚上市,我们今后会逐渐针对这些软件为大家一一进行体验测试,请关注我们的后续文章。

主题:加速|应用