新聞中心

發佈日期 : 2019/04/11

Quadro RTX 5000 開箱評測 | 超強性能等你來看!


Quadro RTX 5000開箱評測

GPU在傳統圖形視覺化領域的應用不斷的擴大,無論是3D設計,大解析度多屏拼接顯示,還是特效渲染,越來越多的人轉向使用更加穩定的專業圖形卡。深度學習和大數據作為新銳行業也大量地使用專業的GPU,以加速訓練研發的速度。NVIDIA最新的Turing架構產品從去年就開始上市。那麼最新的Quadro RTX 5000專業圖形繪圖卡有 哪些改變,又有哪些提升呢?讓我們來做一次開箱評測分享吧。

開箱

RTX 5000整體外觀

  • 本次繪圖卡包裝改變了以往顏色的風格, 使用綠白灰搭配,正面的灰色格子採用漸變的顏色很有現代感和立體感。包裝的正面和頂部、側面都有繪圖卡型號的標識。
  • RTX幾個字有金屬反光效果,凸顯了這代繪圖卡最重要的功能之一 —— 即時光線追蹤。
  • 整體拿在手裡沉沉的,挺有份量,包裝的材質很結實。

拆開包裝

繪圖卡包裝及配件

  • 內部包裝也和以往包裝不一樣,外殼和防震海綿是一體的,繪圖卡安置在其中,給人的感覺是堅固、牢靠。
  • 繪圖卡外面還有一層透明防靜電袋,配線盒裡面有用戶手冊,支援手冊, 8pin轉雙6pin電源線,DP轉DVI轉接頭和DP轉HDMI轉接頭。這是眾多使用DVI顯示器或HDMI顯示器的福音,再也不用另外單獨購買轉接頭了。

繪圖卡正面

  • 繪圖卡外觀主要採用綠 、銀色和黑色搭配,與包裝風格一致。繪圖卡也是沉甸甸的,給人質感很不錯。在繪圖卡正面和脊背上都能看到繪圖卡型號的標識。
  • Quadro RTX 5000 依然是雙插槽繪圖卡,1個渦輪風扇,繪圖卡採用8pin 加6pin的供電方式,對於最大功耗為265W的RTX 5000來講是足夠用了。

繪圖卡頂部介面

  • 繪圖卡頂部總共有3個介面,NVLink、SYNC、Stereo。
  • NVLink技術取代了SLI技術,可以配合Quadro NVLink 2-Slot或者3-Slot使用。NVLink技術不但具備多卡同步輸出的功能,在應用支援的情況下,還能實現顯存疊加的功能,使兩塊卡疊加成一個更大的顯存。
  • SYNC介面要配合Quadro SYNC II卡來使用,實現多卡的顯示信號同步輸出。對於大屏拼接的用戶來講可以延續之前的使用方法。
  • Stereo介面要配合3D立體檔板來輸出3D立體信號。
  • 匯流排界面是PCIE 3.0介面,向下相容PCIE 2.0。目前市場上主機板大都是使用這種介面的。

繪圖卡顯示介面

  • 顯示介面有了新的變化,不是4DP+ DVI的配置,改成了4DP + VirtualLink的配置。
  • DP介面都支援DP 1.4的協定,最高解析度可以達到7680 x4320。 而VirtualLink介面則是下一代VR設備使用的標準介面,一個介面可完成供電、顯示傳輸、控制信號多個功能。

繪圖卡PCB板

性能測試

類別 型號
Motherboard 技嘉Z390 AORUS Master
CPU I9 9900K
DISK NVME SSD 512GB
MEM 64GB DDR4
Graphic RTX 5000
Power ATX 1000W
System Windows 10 64 1809/Ubuntu 16.4
Driver version 419.71

 

使用的軟體清單

SPECviewPerf 13
Superposition Benchmark
Vray Benchmark
CUDA-Z 0.10.251
3Dmark Port Royal
OctaneBench 2019 Preview
NVIDIA Tensorflow example

繪圖卡參數

  RTX 5000 P5000
CUDA Cores 3072 2560
Tensor Core 384 N/A
RT Core 48 N/A
GPU Memory 16 GB GDDR6 16 GB GDDR5X
Graphics Bus PCI Express 3.0 x 16 PCI Express 3.0 x 16
Bridge Mode NVLink SLI
Display connectors DP1.4(4), VirtualLink (1) DP1.4(4) DVI-D (1)
VRReady YES YES
SYNC Quadro SYNC II Quadro SYNC II
Power consumption Total board power:265W Total board power:180W

a. SPECviewperf 13

SPECviewperf 13 是基於專業應用上衡量圖形性能被廣泛應用的測試軟體。該軟體對基於OpenGL和DirectX的專業繪圖軟體進行基準評測,SPECviewperf 13帶來了全新的9個專業圖形測試場景, SPECviewperf 13測試更加貼近真實的工作應用, 其中一些測試場景甚至包含有超過6,000萬個定點資料,能夠充分反映出繪圖卡的專業圖形性能,此次測試我們使用軟體預設配置進行評測。

從測試結果來看,RTX 5000在所有項目上普遍超越了Quadro P5000,snx的性能甚至增加了40%以上。看來Turing架構增加的不僅僅是光線追蹤和深度學習的效率,在專業應用的性能上增加的幅度也是很大的。

b. SuperPosition Benchmark

這款軟體更像是在一個複雜的遊戲環境,在不同的光場效果中對繪圖卡DX和OpenGL渲染性能及穩定性的評測。

在DirectX的性能方面,RTX 5000比P5000提高了近45%, 在OpenGL方面,RTX 5000比P5000提高了性能提高了50%左右。兩個主要的圖形API的性能都增加了很多,相信RTX 5000在專業3D視覺化領域有了更高的可用性。

c. V-Ray Benchmark

Chaos Group 的V-Ray在渲染領域早已被廣大用戶認可了, 由於GPU渲染性能的提升,Chaos Group在V-Ray Next上推出了V-Ray GPU NEXT版本,支持調用NVIDIA CUDA核心進行渲染,隨著技術的不斷更新,GPU渲染的品質上幾乎和CPU沒有區別。GPU運算力強勁渲染時間成本會更低,並且支援多卡加速渲染,所以很多渲染器都在增加自己的GPU渲染功能。本次評估僅測試單卡的渲染性能,時間越短性能越好。

測試截圖

測試結果

從測試結果看,使用最新的RTX 5000比P5000節省了35%的時間。在V-Ray渲染中RTX 5000的效率會更高一些。

d. CUDA-Z

就像我們熟知的CPU-Z 、GPU-Z一樣,CUDA-Z是對NVIDIA GPU處理器的一些基本資訊的採集, GeForce、Quadro、Tesla卡都可以配合使用。

測試截圖

CUDA計算能力

在CUDA-Z的測試項目中,我們實際用到最多的是單精確度浮點運算,如果有使用到雙精度科學計算的,推薦使用GV 100或者GP 100雙精計算能力高的GPU。

RTX 5000單精計算的能力達到了11.7T,相對於前一台P5000提高了36%,提升幅度很大。這麼強的單晶浮點數是CPU不能匹敵的,這也是越來越多的應用把計算從CPU轉向了GPU的原因。

e. 3DMark Port Royal

測試場景

測試結果

目前NVIDIA的RTX渲染的Benchmark功能,3DMark的Port Royal可以支援性能測試。Quadro P5000由於沒有RT Core所以無法使用這個評測軟體。

測試場景裡帶了大量金屬的材質,反射效果驚豔。RTX 5000渲染FPS達到了28左右幀,還算流暢。目前遊戲行業已經有BF5使用這種技術,相信未來在工業製造領域和影視後期領域都會被廣泛的使用。

f. OctaneBench 2019 Preview

OC渲染器是做3D設計及動畫的一款支持GPU渲染的渲染器,可以配合很多3ds Max、CINEMA 4D、NUKE、MODO等3D建模及特效的軟體。OC渲染器是可以支援Out of Core的渲染軟體,最新的OctaneBench 2019 Preview是可以支援RT Core 加速光線追蹤渲染的軟體。我們可以看一下使用和關閉RTX在渲染速度上的區別。

測試截圖

軟體分別在開啟RTX和關閉RTX狀態下對相同場景進行渲染,從測試成績上可以看出, 開啟了RTX On 渲染之後,渲染的速度比關閉RTX渲染速度快了近3倍。可見在RT Core的加成下,渲染速度有了很大的提升。

g. NVIDIA Tensorflow example

我們選擇NVIDIA Tensorflow 的一個示例來測試繪圖卡的性能。在相同參數設置的情況下,繪圖卡在一秒內訓練的圖片數越多,說明繪圖卡在實例深度學習方面的性能越好。

上圖可以看到,RTX 5000在滿載時候每秒處理的數量最多為441張。

P5000在上圖此示例中每秒處理的圖片數最多為194張。

從每秒處理資料的性能上看,RTX 5000處理速度是P5000的2.2倍。速度快了很多,這是由於調用了Tensor Core進行計算的原因。可見Tensor Core在深度學習的加速上還是有很大作用的。Quadro RTX高端繪圖卡都具有Tensor Core,基於這種繪圖卡可以實現圖像加AI的一些應用。例如在渲染的同時可以實現去AI噪點,圖像AI識別,或者其他AI推理的一些工作。

RTX 5000繪圖卡最大的特點是:

  1. 具有RT Core支援RTX即時光線追蹤渲染,能渲染出具有流光溢彩真實感的畫面。渲染速度非常快,在諸多行業視覺化的工業設計流程上會有很好的推動作用。
  2. 具有Tensor Core,可以加速深度學習和AI推理。在人工智慧大力發展的今天,有了Tensor Core的加持,很多應用會變得如虎添翼。
  3. 傳統的圖形應用性能優化和穩定性都繼承了下來,並且性能表現的更好。使用Fermi 、Kepler、Maxwell架構的使用者可以考慮RTX系列繪圖卡進行更新換代了。