NVIDIA RTX A6000全面评测

笔记本测评/2021-06-25 21:55:57 /笔记本测评/阅读:0

时间接近2021年中,世界经济正在从惨痛的疫情当中恢复;而当人们的工作和生活逐渐恢复平常,很多深远的改变却已悄然发生。

  在过去的一年多时间里,绝大多数企业都意识到了数字化转型的重要性,越来越多的办公由远程协作完成,越来越多的工厂也开始转向数字化、无人化和智能化;内容更加短平快的短视频行业保持了烈火烹油的发展态势,进一步成为行业发展主流;更多人将在线互动娱乐作为自己的重要娱乐方式,继续将行业营收和利润快速推高……这些行业是后疫情时代经济增长的代表,更是算力等于生产力的精辟注脚。

  于是,在越来越多人投身这些行业、共享发展红利之时,市场对多元算力的需求也随之爆发。

  算力等于时间,时间等于金钱

  无论是普通制造业常用的Autodesk 123D,或是精密加工制造常用的Cero系列软件,亦或是计算机动画领域常用的Blender和MAYA、室内外建筑设计常用的SketchUp……设计人员的大致工作流程都是用较短的时间构建或导入3D模型,然后用更长的时间等待渲染或分析结果。显然,在这些领域中,等待时间的长短就是生产力强弱的直接表现。因此,处在行业上升通道中的企业要想抢占先机、拿到更多发展红利,除了扩大团队规模之外,使用全新硬件减少工作流中的等待时间就是最直接、最有效的方法。

  那么,问题接踵而至,怎样的硬件才能最可能多的减少工作流中的等待?一路凯歌的NVIDIA其实早已准备好了答案——RTX A6000。

  作为横跨数据中心、数字内容创意和消费娱乐多重领域的芯片行业巨头。NVIDIA已经在过去用海量的顶尖产品无数次证明,无论是在顶尖超算、在AI开发前沿,还是在创意内容工作室或玩家的电脑中,NVIDIA都是绝对算力的保障。

  在公司层面,5月底,NVIDIA公布了有史以来最耀眼的财报;其中,营收56.6亿美元、增幅84%,净利23.13亿美元、增幅107%。而在过去的一年中,NVIDIA股价更从360美元一路挑高至720美元附近。营收、净利和股价的高歌猛进当然有多重市场因素,但更与NVIDIA在2020年底推出的安培架构系列产品取得历史性的成功有关。

  通过大幅提高CUDA单元数量并对SM单元进行重新优化设计,全新的RTX系列显卡性能上迎来了大幅度的提升。当这些表现在数字内容创意领域,就是全新的RTX A6000。

1

  从Quadro P6000到Quadro RTX 6000,显卡的CUDA核心数量从3840增长至4608,增幅20%;但Quadro RTX 6000到RTX A6000,CUDA核心数直接从4608增加至10752,增幅133%。而为了配合CUDA核心数量的巨幅增加,NVIDIA也豪爽的对显存容量进行了翻倍处理;一下子从24GB来到了48GB。

  这也难怪,全新的A6000“给的太多了”,实在无法与传统的Quadro系列相提并论;因此,新的RTX A6000也终于放弃了Quadro前缀,以更简洁有力的“RTX”示人。

  现在,RTX A6000也终于来到PConline评测室,那么就让我们来看看RTX A6000能够在数字内容创意方面带来怎样的提升。

  源自内芯的强大——RTX A6000规格简介:

  安培架构堪称NVIDIA近年来最大的一次革新。除了CUDA数量的大幅增加,相对于上一代产品, 安培架构对SM单元也进行了重新设计。安培架构的一个SM单元最多可以在每个时钟周期内执行128条FP32指令,同时也可以在每个时钟周期内执行64条FP32+64条INT32指令,最终让FP32性能达到翻倍的同时,也兼顾了通用性。

  另一方面,作为NVIDIA的第二代RTX架构,RTX A6000核心内还集成了第2代RT Core和第3代Tensor Core。凭借着翻倍的吞吐量,RTX A6000能提供先进的光线追踪和AI人工智能训练功能。

2

  换句话说,RTX A6000的核心不仅具备更大的处理规模,执行效率也会更高。在行业应用场景中,这意味着创作人员对模型的每一次修改、每一次旋转、每一帧渲染都能更快得到结果。而这种“快”绝不仅仅是等待时间的成倍缩短,更代表在越来越多的场景中,人们都能够得到接近实时的计算机视觉图像反馈。

  或者,用更简单的方式来理解,企业创造价值所需的时间变得比以往更短了。

3

  与普通的娱乐用途不同,定位于生产环境的RTX A6000通常要面对更高的模型精度、更复杂的渲染场景和更高的分辨率。这不仅对核心的计算能力提出了更高要求,也对需要显卡具备更多高效能的显存。RTX A6000配备了48GB GDDR6显存并提供了ECC功能,这就解决了显卡在长时间高负载应用中出现的显存报错问题,为生产应用的可靠性提供了保障。

  在接口层面,RTX A6000首次提供了对PCI-E Gen4的支持,比上代接口高一倍的带宽和更低的延迟有助于RTX A6000在数据密集型应用中获得更好的性能表现。同时,显卡搭载的第三代NVIDIA NVLink互联接口也允许用户在单机内同时安装两张显卡,以便更进一步的提升性能。

  另外,显卡还提供了SYNC接口,用以连接专业的多屏显示同步卡。由此,RTX A6000也可以用在大型控制中心、监控、金融等多屏输出环境。

  测试平台介绍与调试:

  PConline实验室搭建了酷睿i7-11700K+Z490的测试平台,这套平台支持PCIe 4.0,能够让RTX A6000不留瓶颈的发挥性能。此外,在测试前安装了466.11版本驱动。

4

  本次测试还安装了NVIDIA RTX Experience,它的前身名为Quadro Experience,类似于普通游戏显卡的GeForce Experience;NVIDIA RTX Experience可以提供丰富且非常实用的功能,例如使用本地录制和捕获工具、即时分享内容、接收新版企业驱动更新提醒、工作和娱乐优化设置,以充分发挥RTX A6000的全新特性。

  RTX Experience的驱动推送更新功能:

7

  NVIDIA RTX Experience自带的应用程序扫描功能,可以识别当前电脑中安装完成且支持GPU加速的应用程序。

8

  事实上,目前支持GPU做加速的应用程序已经越来越多,能够覆盖各个领域的不同人群。而搭载完整GA102核心的RTX A6000在性能表现方面自然备受期待,下面将正式开始测试。

  理论性能和专业生产力测试:

  首先测试CUDA-Z,这是一个实用的工具,和GPU-Z类似,能够对NVIDIA GPU的信息进行采集。而在CUDA-Z的性能测试中,RTX A6000单精度浮点峰值达到了40T,但双精度浮点依旧被阉割;看来在HPC领域,还是需要搭载GA100核心的DGX A100计算系统。

  SPECviewperf 2020是专业图形工作站领域流行的综合性能测试软件,相比于该系列的上一个大版本SPEC viewperf 13,全新的SPECviewperf 2020对测试子集进行了更新,并引入了一些新素材和新模型。目前包括3ds Max、Maya、Catia、UG NX、Solidworks、Creo等应用负载的性能测试。

13

  SPECviewperf 2020安装和测试时间都比较长,以下是RTX A6000的测试结果:

14

  渲染性能测试:

  V-Ray是由chaosgroup出品的一款高质量渲染软件,是目前业界最受欢迎的渲染引擎。基于V-Ray 内核开发的有VRay for 3ds max、Maya、Sketchup、Rhino等诸多版本,为不同领域的优秀3D建模软件提供了高质量的图片和动画渲染。

  使用V-Ray Benchmark 5进行测试,如果是传统的GPU CUDA渲染,RTX A6000得分1485vpaths。

16

  V-Ray Benchmark 5还支持RTX光线追踪渲染,RTX A6000的分数为2350vrays。

18

  Blender是一款免费开源三维图形图像软件,提供从建模、动画、材质、渲染、到音频处理、视频剪辑等一系列动画短片制作解决方案,本次使用Blender 2.92版本进行测试。

19

  目前,Blender 2.92除了支持传统的CPU渲染之外,也支持GPU CUDA或Optix光追渲染,在偏好设置中可以自由切换。

21

17

  手动导入bwm27、classroom、fishy_cat、koro、pavillon_barcelona和victor等多个素材进行渲染,并记录时间。

  可以看到在Blender 2.92中,无论是CUDA渲染,还是使用Optix光线追踪渲染,RTX A6000都能提供极高的效率,对比酷睿i7-11700K这样的中高端桌面处理器,使用RTX A6000能让渲染的等待时间做到大幅减小。

21

  而说到GPU渲染,那不得不提Octane Render,这是目前非常流行的GPU渲染引擎,受到大多数现代和流行的3D软件的支持,如Cinema 4D,3ds Max,Maya,Revit,Blender,Houdini,Modo等等。而OctaneBench则是基于Octane Render开发的基准测试。

  本次使用OctaneBench 2020.3进行测试,该版本目前也支持Optix光追渲染,开启Enable RTX后,RTX A6000的测试综合得分高达649.49。

25

  当然,即使是不开启Enable RTX,RTX A6000的测试综合得分也能达到525.68。

27

  照片处理和视频编辑测试:

  Procyon是来自UL的一款全新的基准测试套装,为专业用户而打造,目前PC版内置照片编辑基准测试和视频编辑基准测试。

  其中Photo Editing Benchmark是照片编辑基准测试,使用 Adobe Lightroom来导入、处理和修改选定的图像。在测试的第二部分中,Adobe Photoshop中的照片将被进行多次编辑和图层效果。

  Procyon照片编辑基准测试测试过程,使用Adobe Photoshop,测试时安装的Adobe Photoshop版本为22.3.1。

27

  Procyon照片编辑基准测试测试过程,使用Adobe Lightroom进行批量处理,测试时安装的Adobe Lightroom版本为10.2。

222

  照片编辑基准测试结果的综合分数为8540,具体看子项目,Image Retouching分数为8411、Batch Processing分数为8672。

333

  Procyon还提供了Video Editing视频编辑基准测试,该基准测试使用Adobe Premiere Pro将视频项目文件导出为通用格式。每个视频项目都包括各种编辑编辑、调整和效果。基准分数基于导出视频所需的时间。本次测试时安装的Adobe Premiere Pro版本为15.2.0.35。

44

  在Procyon的视频编辑基准测试中,RTX A6000展现出了强大的编解码效率,测试平台综合得分为8204,具体来看GPU硬件加速下H.264 1080p高清视频导出耗时仅为23.742s、H.265 4K UHD超清视频导出耗时也只有50.712s。

222

  DaVinci Resolve是一款在同一个软件工具中,将剪辑、调色、视觉特效、动态图形和音频后期制作融于一身的解决方案,备受好莱坞专业人士欢迎。

66

  DaVinci Resolve对显卡的性能有极高的要求,而这恰恰让RTX A6000有了用武之地。使用PugetBench For DaVinci Resolve V0.92.1进行测试,这套平台的综合分数达到了1373。

77

  总结:

  采用安培架构的RTX A6000使用了三星的先进8nm工艺制造,TDP 300W;虽然功耗提升了约15%,但却迎来性能的大幅提升。这意味着企业在创造更多价值的同时,单位算力的功耗却能够降低很多。对于大型企业、渲染农场或其他算力密集型环境来说,这便是更低OPEX成本的代名词。

  而从性能表现来看,全新的RTX A6000内部集成的过万CUDA核心的确能够在3D设计、渲染等场景中提供更高性能,进而实现更好的应用体验、大幅减少等待。这就能够直接提高创意人员的工作效率,提升最终客户的满意度。

  数字化时代的门扉虽已扣响,但我们也必须承认,距离构建一个完整数字化的世界,我们仍有相当长的路要走。在这条路上,还有太多的产品需要被重新设计,有太多的创意需要观众,有太多的计算等待结果。而RTX A6000所带来的性能提升和等待时间降低则代表企业具备了一条通向更大价值空间的全新路径,一条距离更短、限制更少的高速捷径。

  或许所有人都应该了解,当我们越来越多的被设计所服务、为创意而感动时,算力的进步正在让这一切更快到来!

猜你喜欢

扩展阅读

聚焦

上一篇:联想 YOGA 14s 2021暗夜极光评测 下一篇: 七彩虹将星X15 AT评测

笔记本推荐 hwhidc.cn 联系QQ:32081037 邮箱:32081037@qq.com

Copyright © 2019-2020 性价比高的笔记本 版权所有