新闻中心

发布日期 : 2019/04/11

Quadro RTX 5000 开箱评测 | 超强性能等你来看!


Quadro RTX 5000 开箱评测

GPU在传统图形可视化领域的应用不断的扩大,无论是3D设计,大分辨率多屏拼接显示,还是特效渲染,越来越多的人转向使用更加稳定的专业图形卡。深度学习和大数据作为新锐行业也大量地使用专业的GPU,以加速训练研发的速度。NVIDIA最新的Turing架构产品从去年就开始上市。那么最新的Quadro RTX 5000专业图形显卡有那些改变,又有哪些提升呢?让我们来做一次开箱评测分享吧。

開箱

RTX 5000 整体外观

  • 本次显卡包装改变了以往颜色的风格,使用绿白灰搭配,正面的灰色格子采用渐变的颜色很有现代感和立体感。包装的正面和顶部、侧面都有显卡型号的标识。
  • RTX几个字有金属反光效果,凸显了这代显卡最重要的功能之一——实时光线追踪。
  • 整体拿在手里沉甸甸的,挺有分量,包装的材质很结实。

拆开包装

显卡包装及配件

  • 内部包装也和以往包装不一样,外壳和防震泡沫是一体的,显卡安置在其中,给人的感觉是坚固、牢靠。
  • 显卡外面还有一层透明防静电袋,配线盒里面有用户手册,支持手册, 8pin转双6pin电源线,DP转DVI转接头和DP转HDMI转接头。这是众多使用DVI显示器或HDMI显示器的福音,再也不用另外单独购买转接头了。

显卡正面

  • 显卡外观主要采用绿、银色和黑色搭配,与包装风格一致。显卡也是沉甸甸的,给人质感很不错。在显卡正面和脊背上都能看到显卡型号的标识。
  • Quadro RTX 5000依然是双插槽显卡,1个涡轮风扇,显卡采用8pin 加6pin的供电方式,对于最大功耗为265W的RTX 5000来讲是足够用了。

显卡顶部接口

  • 显卡顶部总共有3个接口,NVLink、SYNC、Stereo。
  • NVLink技术取代了SLI技术,可以配合Quadro NVLink 2-Slot或者3-Slot使用。NVLink技术不但具备多卡同步输出的功能,在应用支持的情况下,还能实现显存叠加的功能,使两块卡叠加成一个更大的显存。
  • SYNC接口要配合Quadro SYNCII卡来使用,实现多卡的显示信号同步输出。对于大屏拼接的用户来讲可以延续之前的使用方法。
  • Stereo接口要配合3D立体档板来输出3D立体信号。
  • 总线接口是PCIE 3.0接口,向下兼容PCIE 2.0。目前市场上主板大都是使用这种接口的。

显卡显示接口

  • 显示接口有了新的变化,不是4DP+ DVI的配置,改成了4DP +VirtualLink的配置。
  • DP接口都支持DP 1.4的协议,最高分辨率可以达到7680 x4320。而VirtualLink接口则是下一代VR设备使用的标准接口,一个接口可完成供电、显示传输、控制信号多个功能。

显卡PCB板

性能测试

类别 型号
Motherboard 技嘉Z390 AORUS Master
CPU I9 9900K
DISK NVME SSD 512GB
MEM 64GB DDR4
Graphic RTX 5000
Power ATX 1000W
System Windows 10 64 1809/Ubuntu 16.4
Driver version 419.71

 

使用的软体清单

SPECviewPerf 13
Superposition Benchmark
Vray Benchmark
CUDA-Z 0.10.251
3Dmark Port Royal
OctaneBench 2019 Preview
NVIDIA Tensorflow example

显卡参数

  RTX 5000 P5000
CUDA Cores 3072 2560
Tensor Core 384 N/A
RT Core 48 N/A
GPU Memory 16 GB GDDR6 16 GB GDDR5X
Graphics Bus PCI Express 3.0 x 16 PCI Express 3.0 x 16
Bridge Mode NVLink SLI
Display connectors DP1.4(4), VirtualLink (1) DP1.4(4) DVI-D (1)
VRReady YES YES
SYNC Quadro SYNC II Quadro SYNC II
Power consumption Total board power:265W Total board power:180W

a. SPECviewperf 13

SPECviewperf 13 是基于专业应用上衡量图形性能被广泛应用的测试软件。该软件对基于OpenGL和DirectX的专业绘图软件进行基准评测,SPECviewperf 13带来了全新的9个专业图形测试场景,SPECviewperf13测试更加贴近真实的工作应用, 其中一些测试场景甚至包含有超过6,000万个定点数据,能够充分反映出显卡的专业图形性能,此次测试我们使用软件默认配置进行评测。

从测试结果来看,RTX 5000在所有项目上普遍超越了Quadro P 5000,snx的性能甚至增加了40%以上。看来Turing架构增加的不仅仅是光线追踪和深度学习的效率,在专业应用的性能上增加的幅度也是很大的。

b. SuperPosition Benchmark

这款软件更像是在一个复杂的游戏环境,在不同的光场效果中对显卡DX和OpenGL渲染性能及稳定性的评测。

在DirectX的性能方面,RTX 5000比P 5000提高了近45%,在OpenGL方面,RTX 5000比P 5000提高了性能提高了50%左右。两个主要的图形API的性能都增加了很多,相信RTX 5000在专业3D可视化领域有了更高的可用性。

c. V-Ray Benchmark

Chaos Group 的V-Ray在渲染领域早已被广大用户认可了,由于GPU渲染性能的提升,Chaos Group在V-Ray Next上推出了V-Ray GPU NEXT版本,支持调用NVIDIA CUDA核心进行渲染,随着技术的不断更新,GPU渲染的质量上几乎和CPU没有区别。GPU算力强劲渲染时间成本会更低,并且支持多卡加速渲染,所以很多渲染器都在增加自己的GPU渲染功能。本次评估仅测试单卡的渲染性能,时间越短性能越好。

测试截图

测试结果

从测试结果看,使用最新的RTX 5000比P 5000节省了35%的时间。在V-Ray渲染中RTX 5000的效率会更高一些。

d. CUDA-Z

就像我们熟知的CPU-Z 、GPU-Z一样,CUDA-Z是对NVIDIA GPU处理器的一些基本信息的采集, GeForce、Quadro、Tesla卡都可以配合使用。

测试截图

CUDA计算能力

在CUDA-Z的测试项目中,我们实际用到最多的是单精度浮点运算,如果有使用到双精度科学计算的,推荐使用GV 100或者GP 100双精计算能力高的GPU。

RTX 5000单精计算的能力达到了11.7T,相对于前一台P 5000提高了36%,提升幅度很大。这么强的单晶浮点数是CPU不能匹敌的,这也是越来越多的应用把计算从CPU转向了GPU的原因。

e. 3DMark Port Royal

测试场景

测试结果

目前NVIDIA的RTX渲染的Benchmark功能,3DMark的Port Royal可以支持性能测试。Quadro P 5000由于没有RT Core所以无法使用这个评测软件。

测试场景里带了大量金属的材质,反射效果惊艳。RTX 5000渲染FPS达到了28左右帧,还算流畅。目前游戏行业已经有BF5使用这种技术,相信未来在工业制造领域和影视后期领域都会被广泛的使用。

f. OctaneBench 2019 Preview

OC渲染器是做3D设计及动画的一款支持GPU渲染的渲染器,可以配合很多3ds Max、CINEMA 4D、NUKE、MODO等3D建模及特效的软件。OC渲染器是可以支持Out of Core的渲染软件,最新的OctaneBench 2019 Preview是可以支持RT Core 加速光线追踪渲染的软件。我们可以看一下使用和关闭RTX在渲染速度上的区别。

测试截图

软件分别在开启RTX和关闭RTX状态下对相同场景进行渲染,从测试成绩上可以看出,开启了RTX On 渲染之后,渲染的速度比关闭RTX渲染速度快了近3倍。可见在RT Core的加成下,渲染速度有了很大的提升。

g. NVIDIA Tensorflow example

我们选择NVIDIA Tensorflow的一个示例来测试显卡的性能。在相同参数设置的情况下,显卡在一秒内训练的图片数越多,说明显卡在实例深度学习方面的性能越好。

上图可以看到,RTX 5000在满载时候每秒处理的数量最多为441张。

P 5000在上图此示例中每秒处理的图片数最多为194张。

从每秒处理数据的性能上看,RTX 5000处理速度是P 5000的2.2倍。速度快了很多,这是由于调用了Tensor Core进行计算的原因。可见Tensor Core在深度学习的加速上还是有很大作用的。Quadro RTX高端显卡都具有Tensor Core,基于这种显卡可以实现图像加AI的一些应用。例如在渲染的同时可以实现去AI噪点,图像AI识别,或者其他AI推理的一些工作。

RTX 5000显卡最大的特点是:

  1. 具有RT Core支持RTX实时光线追踪渲染,能渲染出具有流光溢彩真实感的画面。渲染速度非常快,在诸多行业可视化的工业设计流程上会有很好的推动作用。
  2. 具有Tensor Core,可以加速深度学习和AI推理。在人工智能大力发展的今天,有了Tensor Core的加持,很多应用会变得如虎添翼。
  3. 传统的图形应用性能优化和稳定性都继承了下来,并且性能表现的更好。使用Fermi 、Kepler、Maxwell架构的用户可以考虑RTX系列显卡进行更新换代了。