NVIDIA® Quadro RTX™ 8000 使用 NVIDIA Turing™ 架構及 NVIDIA RTX™ 平台,為專業工作流程帶來電腦繪圖領域十餘年來最重大的進步。設計師和藝術家現在可以利用硬體加速光線追蹤,深度學習,和高級著色的強大功能,大幅提高生產力,並以前所未有的速度創作出色的內容。
Quadro RTX 8000具有72個用於即時光線追踪的RT核心和用於AI增強工作流程的576個Tensor核心,可實現超過130 TFLOPS的深度學習效能。 Quadro RTX 8000採用48 GB GDDR6記憶體,可通過 NVIDIA NVLink 技術擴展至96 GB,可適用於大容量記憶體需求的高負載工作,例如創造最複雜的模型,建構大量架構數據集,可視化大量數據科學工作負載,使用即時8K電影內容,加快高解析度之最終渲染速度。 VirtualLink® 提供與下一代高分辨率VR 頭戴式顯示器的連接,使您可以在最引人注目的虛擬環境中查看您的工作。
用高速互連方式連接兩個 GPU,將記憶體容量擴展到 96 GB,並以 100 GB/s 的資料傳輸率提供更高效能。
配備業界率先採用的 48 GB 超高速 GDDR6 記憶體,可儲存複雜的設計,龐大的建築資料集,8K 電影內容等。
NVIDIA Turing 配備用於光線追蹤的全新 RT 核心,用於人工智慧的 576 個Tensor核心,以及用於平行運算的 4608 個 CUDA 核心,是世界上最先進的繪圖處理器。
業界首創的 VirtualLink 用來簡化現有及下一代的高解析度 VR 頭戴式顯示器的連接。
用 NVLink 連接兩張 Quadro RTX 8000 將有效可用記憶體加倍,並可利用高達 100GB/s (雙向總頻寬) 的 GPU 對 GPU 資料傳輸率將應用程式效能擴張 。
利用多個 GPU 動態擴展繪圖效能,加強影像品質,擴大顯示空間,並組裝一套完全虛擬化的系統。
使用高達 64X FSAA (SLI 模式下 128倍) 大幅降低視覺混疊偽像或「鋸齒」以獲得優秀的影像品質和極為逼真的場景。
材質來自並成像到 32K x 32K 表面以支援需要最高解析度和品質的影像處理應用程式。
在單一系統的 8 個 GPU 中同步最多 32 個顯示器的顯示和畫面輸出 (透過兩張 Sync II 介面卡連接),減少建立高階影像可視化環境所需的機器數量。
深度學習框架例如 Caffe2, MXNet, CNTK, TensorFlow 等可以大幅加快訓練時間並提高多節點訓練效能。GPU 加速函式庫如 cuDNN, cuBLAS, 和 TensorRT 為深度學習推理和高速計算 (HPC) 應用程式提供更高的效能。
原生執行標準程式語言如 C/C++ 和 Fortran,以及 API 如 OpenCL,OpenACC 和 Direct Compute,以加速光線追蹤,影片和影像處理,以及流體力學計算等技術。
單一無縫的 49 位元虛擬位址空間可讓資料在 CPU 和 GPU 完全分配的記憶體內透明的移動。
GPUDirect for Video 經由避免不必要的系統記憶體資料複製和 CPU 負擔來加速 GPU 和影像 I/O 裝置間的溝通。
M將系統正常運作時間最大化,無縫管理大規模部署並遠端控制圖形和顯示設定,以實現高效率運作。
GPU 架構 | Turing |
CUDA 平行處理核心 | 4608 |
NVIDIA Tensor核心 | 576 |
NVIDIA RT 核心 | 72 |
記憶體 | 48 GB GDDR6 |
RTX-OPS | 84T |
光線投射 | 10 Giga Rays/Sec |
最高單精度 (FP32) 效能 | 16.3 TFLOPS |
最高半精度 (FP16) 效能 | 32.6 TFLOPS |
最高整數運算 (INT8) 效能 | 261.0 TOPS |
深度學習 TeraFLOPS1 | 130.5 Tensor TFLOPS |
記憶體介面 | 384-bit |
記憶體頻寬 | 672 GB/s |
最大功耗 | 295 W |
匯流排 | PCI Express 3.0 x16 |
顯示接頭 | DP 1.4 (4) + VirtualLink (1) |
外部電源接頭 | 1x 8-pin & 1x 6-pin |
板型 | 4.4” 高 x 10.5” 長 雙槽 |
重量 | 1.002 kg |
散熱方案 | 主動式 |
NVIDIA® 3D Vision® 和 3D Vision Pro | 由 3 pin mini DIN 支援 |
框頁鎖 (Frame Lock) | 相容 (與 Quadro Sync II) |
NVLink 互連技術 | 100 GB/s |
1 FP16 矩陣乘以 with FP16 或 FP32 累加