NVIDIA RTX PRO™ 6000 Blackwell 工作站繪圖卡 是史上最強大的工作站 GPU,重新定義了專業領域的效能與能力。憑藉無與倫比的 AI 運算能力,讓您輕鬆駕馭最先進的模型並應對最嚴苛的創意工作流程。採用突破性的 NVIDIA Blackwell 架構,並配備 96GB 超高速 GDDR7 記憶體,RTX PRO 6000 工作站 GPU 提供無與倫比的速度、精準度與效率,助您實現不可能的目標。
專為追求極致效能的專業人士設計,NVIDIA RTX PRO 解決方案 提供無與倫比的效能、穩定性與支援。每張 GPU 都經過嚴格測試,以滿足各種設計、工程與 AI 工作流程的需求,並透過企業級驅動程式持續優化。憑藉廣泛的 ISV 認證、強大的 IT 管理工具 和企業級技術支援,RTX PRO 工作站 成為企業部署與關鍵任務應用的信賴之選。
NVIDIA Blackwell 架構 結合突破性的 AI、光線追蹤 和 神經圖形技術,並大幅提升效能與記憶體容量,驅動最尖端的專業創意、設計與工程工作流程,讓使用者隨時隨地發揮最佳實力。NVIDIA RTX PRO™ Blackwell 世代 GPU 是目前最先進的工作站 GPU,提供卓越的運算能力,支援高效能即時光線追蹤、AI 加速計算與專業級圖形渲染。
Blackwell 串流多處理器 (SM) 整合次世代 CUDA 核心 與 神經著色器 (Neural Shaders),重新定義 AI 強化的圖形與運算效能。相較於前一代架構,Blackwell SM 架構的 FP32 浮點運算效能提升高達 1.4 倍,可擴展至 每顆 GPU 擁有 24,064 個 CUDA 核心,並提供 最高 125 TFLOPS 的單精度浮點運算效能,滿足工業級模擬、3D 建模與光線追蹤渲染需求。全新的 神經著色器 直接將 AI 嵌入可編程管線,實現 RTX Mega Geometry 與 DLSS 4.0 多幀生成 等混合式工作流程。Blackwell SM 支援 FP64、FP32、FP16 與 BF16 等多種運算精度,搭載更大的 L2 快取 與更高的時脈速度,大幅提升 張量運算、稀疏神經網路 及 擬真渲染 效率,為 AECO、製造業與媒體 領域提供強大支援。這種統一設計確保光線追蹤、AI 推論與運算任務 可同時執行,讓專業人士能夠以前所未有的效率,迎接 次世代 AI 強化工作流程 的挑戰。
第五代 Tensor 核心 加速神經網路訓練與推論所需的深度學習矩陣運算。這些核心具備 Fine-Grained Structured Sparsity (細粒度結構化稀疏性) 技術,相較於前一代,運算吞吐量提升達 3 倍,大幅優化稀疏神經網路的效能。第五代 Tensor 核心支援 混合精度運算,新增 FP4 支援,以實現 更大規模的吞吐量提升,同時支援 TF32、BF16、FP16、FP8 及 FP6 等數據類型,提供 AI 模型開發的高度靈活性。獨立的浮點與整數數據通道 讓計算與任務處理能夠並行化,加速複雜工作負載的處理。此外,這些核心還強化了 DLSS 4 多幀生成,實現 即時 AI 渲染 及 高精細內容創作。對開發者而言,這代表著 工作站 AI 運算能力提升至前一代的 3 倍,記憶體容量加倍,讓 本地 LLM 原型開發、工業級推論與次世代 AI 模型部署 更快速高效,並且完全向下相容於現有的 AI 框架。
第四代 RT 核心 可實現真實感神經圖形,相較於前一代,光線追蹤效能提升最高達 2 倍,進而打造具備物理準確陰影、反射與折射的寫實場景渲染。透過RTX Mega Geometry 等基於神經圖形技術的創新功能,可實現 最多 100 倍 的光線追蹤三角形數量,進而創建高擬真、物理精確的場景與沉浸式 3D 設計。這些核心專為工業級精度而設計,特別適用於產品原型開發、沉浸式 3D 環境,以及 M&E(媒體與娛樂)內容創作,同時顯著縮短設計迭代週期,帶來前所未有的生產力提升。結合 NVIDIA OptiX、Microsoft DXR 及 Vulkan 光線追蹤等 API,RTX PRO GPU 所驅動的系統能夠支援真正的互動式設計流程,提供即時反饋,進一步提升生產力與創作效率。
NVIDIA Blackwell GPU 架構新增4:2:2 色度取樣影片的硬體編碼與解碼支援,大幅提升該格式的處理效能,讓專業創作者減少等待與處理代理檔的時間,專注於創作與作品交付。相比 4:2:0 色度取樣,4:2:2 保留更多色彩資訊,特別適用於HDR 內容,以及需要精準保留細節(如文字或細線)的影像處理。此外,在需要反覆進行色彩校正(如調色流程)的工作中,4:2:2 色度取樣可確保更高的影像品質,維持原始畫面的色彩準確度與細節。
第 9 代 NVIDIA NVENC 引擎顯著加速影片編碼速度,並提升專業影片應用的畫質表現。新增對4:2:2 H.264 與 HEVC 編碼的支援,同時提升 AV1 與 HEVC 的編碼品質,使 BD-BR PSNR 增加 5%。此外,新增AV1 超高畫質(UHQ)模式,透過更長時間的編碼處理,進一步提升 5% 的畫質,以實現最佳影像品質。NVENC 可處理最嚴苛的 4K 或 8K 影片編碼工作,將影片編碼負載從 GPU 圖形運算核心與 CPU 釋放,讓系統能夠同時執行其他任務。在專業影片編輯應用中,8K/60fps 影片編碼亦可順暢進行。RTX PRO GPU 提供與軟體編碼器「中等預設」相當的畫質,但效能提升 2 倍,為專業影像工作者提供更高效的工作流程。
第 6 代 NVIDIA NVDEC 引擎的 H.264 解碼效能較前一代提升最多 2 倍,並新增支援 4:2:2 H.264 與 HEVC 解碼。這項技術可讓專業使用者享受高畫質影片播放,加速影片數據導入,並運用AI 驅動的進階影片編輯功能。NVDEC 支援以下硬體加速解碼的影片格式:MPEG-2 、 VC-1 、H.264 (AVCHD) 、 H.265 (HEVC) 、 VP8 、 VP9 、 AV1 。這項技術讓專業工作者能夠更高效地處理高解析度影片,提升影片編輯與播放的流暢度,滿足各類專業應用需求。
全新升級的 GDDR7 記憶體 大幅提升頻寬與容量,讓您的應用程式運行更快速,並能處理更大、更複雜的數據集。最高支援 96GB GPU 記憶體,可應對大規模 3D 與 AI 專案,探索大型 VR 環境,並驅動更廣泛的多應用工作流程。GDDR7 記憶體提供高達 2 倍的記憶體頻寬,加速光線追蹤、渲染與 AI 工作負載。RTX PRO GPU 擁有業界領先的超大圖形記憶體容量,滿足低延遲專業應用對於大規模數據集與模型的需求。
GDDR7 記憶體對錯誤校正碼(ECC)的原生支援,透過側頻 ECC(Sideband ECC)機制,在獨立於主記憶體的小區域中存儲 ECC 位元,確保更高的數據可靠性,且不會產生性能損失或額外的容量資源。ECC 位元可用於校正單位元錯誤或標記雙位元錯誤。RTX PRO GPU 具備強大的 ECC 功能,確保工作站在執行關鍵任務應用時,維持無可妥協的計算準確性與數據可靠性。
RTX PRO 系列採用 Max-Q 技術 的優化方案,提供針對多 GPU 高密度配置和小型機殼系統進行最佳化的設計,以最大化效率。例如,RTX PRO 6000 工作站繪圖卡的強大性能,帶入支援多 GPU 的系統,可構建 4 張 GPU 的高密度配置,在單一工作站內提供高達 384GB GPU 記憶體,讓您在桌面級設備上擁有強大的運算能力。
RTX PRO GPU 支援 PCI Express Gen 5,透過 x16 連接提供高達 64 GB/sec 的頻寬(是 PCIe Gen 4 的兩倍),可提升從 CPU 記憶體到 GPU 的數據傳輸速度,特別適用於 AI 和數據科學等高數據量工作負載。更快的 PCIe 性能還能加速 GPU 直接記憶體存取(DMA)傳輸,使 GPUDirect 技術能夠更快地處理影片數據傳輸,並透過 GPUDirect Storage 提供更高效的輸入輸出性能。
將 GPU 任務調度從 CPU 卸載至 GPU,減少瓶頸與延遲,釋放 CPU 資源以處理關鍵任務(如數據處理、I/O 操作),提升複雜工作流程的回應速度,同時最大化 GPU 利用率。以滿足高需求的創意、工程或科學計算工作。此技術可優化 AI 和圖形任務的並行運行(如 AI 去雜訊、即時物理模擬),加速 Omniverse 等工具的工作流程,或提升 AI 增強設計軟體的效率,實現更快速、流暢的生產力體驗。
RTX PRO 6000 系列 GPU 支援多實例 GPU (MIG) 虛擬化與 GPU 分割功能。當配置為 MIG 模式時,RTX PRO 6000 可提供最多 4 個獨立的 GPU 實例。強大的錯誤隔離技術可確保 RTX PRO 6000 系列 GPU 的分割過程安全且可靠。
像素級搶佔(Pixel-level Preemption)提供更精細的控制,能更有效支援 VR 動作追蹤等時間敏感型任務。
指令級搶佔(Instruction-level Preemption)提供更精細的計算任務控制,防止長時間運行的應用程式壟斷系統資源或導致超時。
透過 DisplayPort 2.1b,專業使用者可實現無與倫比的視覺清晰度與效能,支援高達 8K @ 240Hz 和 16K @ 60Hz 的顯示輸出。更高的頻寬允許流暢的多螢幕配置,非常適合多工處理與協作,而 HDR 及更高色深的支援則確保了卓越的色彩準確度,適用於影片剪輯、3D 設計與直播等精細工作。
單張顯示卡可支援:最多 4 個 4K 顯示器 @ 165Hz 或 最多 2 個 8K 顯示器 @ 100Hz(使用 DSC 透過 DP 或 HDMI)。最高連線速率需使用 DP80LL 認證線材。
讓使用者對桌面體驗擁有前所未有的控制權,無論是在單一大螢幕還是多螢幕環境中,都能提升工作效率,特別適用於當前流行的大尺寸寬螢幕顯示器。
可同步單一系統內多達 32 個顯示器的顯示與影像輸出(透過 8 張 GPU 與 2 張 Sync 板卡 連接),減少建構高階視覺化環境所需的機器數量。或可擴展至多台系統,透過 Sync 技術同步數百個顯示器,適用於大規模部署。當 RTX PRO Blackwell GPU(4000 級及以上) 搭配 RTX PRO Sync 附加卡 時,還可支援 可變更新率 (VRR),最高可達 1000Hz。VRR 讓同步顯示器的刷新率能靈活變化,迅速適應低延遲場景,提升視覺體驗。
可讓單一工作站無縫擴展桌面與應用程式至最多 4 張 GPU 與 16 個顯示器,同時提供完整效能與卓越畫質。支援解析度:Windows 最高 16K x 16K 或 Linux 最高 32K x 32K 。Mosaic 技術可與 RTX PRO Sync 結合,確保此配置下的顯示器同步運行。
透過專用連接埠,直接同步 3D 立體硬體與 NVIDIA RTX PRO 顯示卡,實現強大且精確的立體效果控制。
NVIDIA App 為您的桌面工作站提供一套生產力工具,包括最高 8K 解析度的桌面錄製、最新 NVIDIA RTX Enterprise 驅動程式更新的自動提醒,以及遊戲功能存取。此應用程式可在 此處下載。
深度學習框架(如 Caffe2、MXNet、CNTK、TensorFlow 等)可顯著縮短訓練時間,並提升多節點訓練效能。GPU 加速庫(如 cuDNN、cuBLAS 和 TensorRT)可為深度學習推論與高效能運算(HPC)應用提供更高的效能。立即使用 NVIDIA AI Workbench,只需幾個點擊即可運行範例專案或建立自訂環境,並內建一鍵協作功能,方便團隊合作。當您準備部署時,NVIDIA AI Enterprise 提供大規模的企業級預訓練模型、工具與支援,適用於各種規模的 AI 部署。
可直接執行 C/C++、Fortran 等標準程式語言,以及 OpenCL、OpenACC、Direct Compute 等 API,加速光線追蹤、影片與影像處理、計算流體力學等技術運算。
GPUDirect for Video 透過避免不必要的系統記憶體複製與 CPU 負擔,加速 GPU 與視訊 I/O 裝置之間的通訊,提高數據傳輸效率。
最大化系統運行時間,無縫管理大規模部署,並遠端控制圖形與顯示設定,以提升運營效率。
1 原 NVIDIA Quadro Sync II,將於 2025 年 3 月 18 日起更名。
2 支援需求:需使用 Linux 作業系統與 NVIDIA RTX Enterprise Driver R387 或更新版本。若超過 4 張 GPU,需 NVIDIA SLI 認證系統。
3 NVIDIA App 統一整合 NVIDIA 控制面板 與 NVIDIA RTX Experience™ 應用程式。
GPU 架構 | NVIDIA Blackwell |
CUDA 平行處理核心 | 24,064 |
NVIDIA Tensor 核心 | 752 |
NVIDIA RT 核心 | 188 |
單精度效能1 | 125 TFLOPS |
AI 效能1 | 4000 AI TOPS2 |
RT 核心效能1 | 380 TFLOPS |
GPU 記憶體 | 96 GB GDDR7 with ECC |
記憶體介面 | 512-bit |
記憶體頻寬 | 1792 GB/s |
最大功耗 | 600W |
多實例 GPU | 最高達 4x 24GB 最高達 2x 48GB 最高達 1x 96GB |
繪圖匯流排 | PCI Express 5.0 x16 |
顯示連接器 | DP 2.1 (4) |
外形規格 | 5.4”高 x 12”長, 超高全長 雙插槽 |
產品重量 | 1.950 kg |
散熱方式 | 雙向氣流設計 |
NVIDIA® 3D Vision® 與 3D Vision Pro | 透過 3-pin Mini DIN 提供支援 |
顯示同步 | 與 NVIDIA RTX PRO Sync 相容 |
外部電源連接端子 | 1x PCIe CEM5 16-pin |
NVENC | NVDEC | JPEG | 4x | 4x | 4x |
1 峰值速率基於 GPU Boost 時脈
2 使用稀疏性功能的理論 FP4 TOPS