使用 NVIDIA RTX PRO 5000 Blackwell 將您的專業工作流程提升至全新境界。這款 GPU 採用最新的 NVIDIA 架構,配備 48GB 高速 GDDR7 記憶體,提供卓越的效能、圖形與 AI 能力,為新一代設計、資料科學、模擬與 AI 工作流程注入強大動力。借助 NVIDIA 的 AI 技術,專業人士可加速工作流程,將複雜專案變為現實,實現令人驚艷的成果,同時享受流暢的多工處理與更高效的協作體驗。
專為追求極致效能的專業人士設計,NVIDIA RTX PRO 解決方案 提供無與倫比的效能、穩定性與支援。每張 GPU 都經過嚴格測試,以滿足各種設計、工程與 AI 工作流程的需求,並透過企業級驅動程式持續優化。憑藉廣泛的 ISV 認證、強大的 IT 管理工具 和企業級技術支援,RTX PRO 工作站 成為企業部署與關鍵任務應用的信賴之選。
NVIDIA Blackwell 架構 結合突破性的 AI、光線追蹤 和 神經圖形技術,並大幅提升效能與記憶體容量,驅動最尖端的專業創意、設計與工程工作流程,讓使用者隨時隨地發揮最佳實力。NVIDIA RTX PRO™ Blackwell 世代 GPU 是目前最先進的工作站 GPU,提供卓越的運算能力,支援高效能即時光線追蹤、AI 加速計算與專業級圖形渲染。
Blackwell 串流多處理器 (SM) 整合次世代 CUDA 核心 與 神經著色器 (Neural Shaders),重新定義 AI 強化的圖形與運算效能。相較於前一代架構,Blackwell SM 架構的 FP32 浮點運算效能提升高達 1.4 倍,可擴展至 每顆 GPU 擁有 12,800 個 CUDA 核心,滿足工業級模擬、3D 建模與光線追蹤渲染需求。全新的 神經著色器 直接將 AI 嵌入可編程管線,實現 RTX Mega Geometry 與 DLSS 4.0 多幀生成 等混合式工作流程。Blackwell SM 支援 FP64、FP32、FP16 與 BF16 等多種運算精度,搭載更大的 L2 快取 與更高的時脈速度,大幅提升 張量運算、稀疏神經網路 及 擬真渲染 效率,為 AECO、製造業與媒體 領域提供強大支援。這種統一設計確保光線追蹤、AI 推論與運算任務 可同時執行,讓專業人士能夠以前所未有的效率,迎接 次世代 AI 強化工作流程 的挑戰。
第五代 Tensor 核心 加速神經網路訓練與推論所需的深度學習矩陣運算。這些核心具備 Fine-Grained Structured Sparsity (細粒度結構化稀疏性) 技術,相較於前一代,運算吞吐量提升達 3 倍,大幅優化稀疏神經網路的效能。第五代 Tensor 核心支援 混合精度運算,新增 FP4 支援,以實現 更大規模的吞吐量提升,同時支援 TF32、BF16、FP16、FP8 及 FP6 等數據類型,提供 AI 模型開發的高度靈活性。獨立的浮點與整數數據通道 讓計算與任務處理能夠並行化,加速複雜工作負載的處理。此外,這些核心還強化了 DLSS 4 多幀生成,實現 即時 AI 渲染 及 高精細內容創作。對開發者而言,這代表著 工作站 AI 運算能力提升至前一代的 3 倍,記憶體容量加倍,讓 本地 LLM 原型開發、工業級推論與次世代 AI 模型部署 更快速高效,並且完全向下相容於現有的 AI 框架。
第四代 RT 核心 可實現真實感神經圖形,相較於前一代,光線追蹤效能提升最高達 2 倍,進而打造具備物理準確陰影、反射與折射的寫實場景渲染。透過RTX Mega Geometry 等基於神經圖形技術的創新功能,可實現 最多 100 倍 的光線追蹤三角形數量,進而創建高擬真、物理精確的場景與沉浸式 3D 設計。這些核心專為工業級精度而設計,特別適用於產品原型開發、沉浸式 3D 環境,以及 M&E(媒體與娛樂)內容創作,同時顯著縮短設計迭代週期,帶來前所未有的生產力提升。結合 NVIDIA OptiX、Microsoft DXR 及 Vulkan 光線追蹤等 API,RTX PRO GPU 所驅動的系統能夠支援真正的互動式設計流程,提供即時反饋,進一步提升生產力與創作效率。
NVIDIA Blackwell GPU 架構新增4:2:2 色度取樣影片的硬體編碼與解碼支援,大幅提升該格式的處理效能,讓專業創作者減少等待與處理代理檔的時間,專注於創作與作品交付。相比 4:2:0 色度取樣,4:2:2 保留更多色彩資訊,特別適用於HDR 內容,以及需要精準保留細節(如文字或細線)的影像處理。此外,在需要反覆進行色彩校正(如調色流程)的工作中,4:2:2 色度取樣可確保更高的影像品質,維持原始畫面的色彩準確度與細節。
第 9 代 NVIDIA NVENC 引擎顯著加速影片編碼速度,並提升專業影片應用的畫質表現。新增對4:2:2 H.264 與 HEVC 編碼的支援,同時提升 AV1 與 HEVC 的編碼品質,使 BD-BR PSNR 增加 5%。此外,新增AV1 超高畫質(UHQ)模式,透過更長時間的編碼處理,進一步提升 5% 的畫質,以實現最佳影像品質。NVENC 可處理最嚴苛的 4K 或 8K 影片編碼工作,將影片編碼負載從 GPU 圖形運算核心與 CPU 釋放,讓系統能夠同時執行其他任務。在專業影片編輯應用中,8K/60fps 影片編碼亦可順暢進行。RTX PRO GPU 提供與軟體編碼器「中等預設」相當的畫質,但效能提升 2 倍,為專業影像工作者提供更高效的工作流程。
第 6 代 NVIDIA NVDEC 引擎的 H.264 解碼效能較前一代提升最多 2 倍,並新增支援 4:2:2 H.264 與 HEVC 解碼。這項技術可讓專業使用者享受高畫質影片播放,加速影片數據導入,並運用AI 驅動的進階影片編輯功能。NVDEC 支援以下硬體加速解碼的影片格式:MPEG-2 、 VC-1 、H.264 (AVCHD) 、 H.265 (HEVC) 、 VP8 、 VP9 、 AV1 。這項技術讓專業工作者能夠更高效地處理高解析度影片,提升影片編輯與播放的流暢度,滿足各類專業應用需求。
全新升級的 GDDR7 記憶體 大幅提升頻寬與容量,讓您的應用程式運行更快速,並能處理更大、更複雜的數據集。最高支援 48GB GPU 記憶體,可應對大規模 3D 與 AI 專案,探索大型 VR 環境,並驅動更廣泛的多應用工作流程。GDDR7 記憶體提供高達 2 倍的記憶體頻寬,加速光線追蹤、渲染與 AI 工作負載。RTX PRO 5000 Blackwell GPU 擁有業界領先的超大圖形記憶體容量,滿足低延遲專業應用對於大規模數據集與模型的需求。
GDDR7 記憶體對錯誤校正碼(ECC)的原生支援,透過側頻 ECC(Sideband ECC)機制,在獨立於主記憶體的小區域中存儲 ECC 位元,確保更高的數據可靠性,且不會產生性能損失或額外的容量資源。ECC 位元可用於校正單位元錯誤或標記雙位元錯誤。RTX PRO GPU 具備強大的 ECC 功能,確保工作站在執行關鍵任務應用時,維持無可妥協的計算準確性與數據可靠性。
RTX PRO 系列採用 Max-Q 技術 的優化方案,提供針對多 GPU 高密度配置和小型機殼系統進行最佳化的設計,以最大化效率。讓您在桌上型設備上擁有強大的運算能力。
RTX PRO GPU 支援 PCI Express Gen 5,透過 x16 連接提供高達 64 GB/sec 的頻寬(是 PCIe Gen 4 的兩倍),可提升從 CPU 記憶體到 GPU 的數據傳輸速度,特別適用於 AI 和數據科學等高數據量工作負載。更快的 PCIe 性能還能加速 GPU 直接記憶體存取(DMA)傳輸,使 GPUDirect 技術能夠更快地處理影片數據傳輸,並透過 GPUDirect Storage 提供更高效的輸入輸出性能。
將 GPU 任務調度從 CPU 卸載至 GPU,減少瓶頸與延遲,釋放 CPU 資源以處理關鍵任務(如數據處理、I/O 操作),提升複雜工作流程的回應速度,同時最大化 GPU 利用率。以滿足高需求的創意、工程或科學計算工作。此技術可優化 AI 和圖形任務的並行運行(如 AI 去雜訊、即時物理模擬),加速 Omniverse 等工具的工作流程,或提升 AI 增強設計軟體的效率,實現更快速、流暢的生產力體驗。
RTX PRO 5000 Blackwell GPU 支援多實例 GPU (MIG) 虛擬化與 GPU 分割功能。當配置為 MIG 模式時,RTX PRO 5000 可提供最多 2 個獨立的 GPU 實例。強大的錯誤隔離技術可確保 RTX PRO 5000 GPU 的分割過程安全且可靠。
像素級搶佔(Pixel-level Preemption)提供更精細的控制,能更有效支援 VR 動作追蹤等時間敏感型任務。
指令級搶佔(Instruction-level Preemption)提供更精細的計算任務控制,防止長時間運行的應用程式壟斷系統資源或導致超時。
透過 DisplayPort 2.1b,專業使用者可實現無與倫比的視覺清晰度與效能,支援高達 8K @ 240Hz 和 16K @ 60Hz 的顯示輸出。更高的頻寬允許流暢的多螢幕配置,非常適合多工處理與協作,而 HDR 及更高色深的支援則確保了卓越的色彩準確度,適用於影片剪輯、3D 設計與直播等精細工作。
單張顯示卡可支援:最多 4 個 4K 顯示器 @ 165Hz 或 最多 2 個 8K 顯示器 @ 100Hz(使用 DSC 透過 DP 或 HDMI)。最高連線速率需使用 DP80LL 認證線材。
讓使用者對桌面體驗擁有前所未有的控制權,無論是在單一大螢幕還是多螢幕環境中,都能提升工作效率,特別適用於當前流行的大尺寸寬螢幕顯示器。
可同步單一系統內多達 32 個顯示器的顯示與影像輸出(透過 8 張 GPU 與 2 張 Sync 板卡 連接),減少建構高階視覺化環境所需的機器數量。或可擴展至多台系統,透過 Sync 技術同步數百個顯示器,適用於大規模部署。當 RTX PRO 5000 Blackwell GPU 搭配 RTX PRO Sync 附加卡 時,還可支援 可變更新率 (VRR),最高可達 1000Hz。VRR 讓同步顯示器的刷新率能靈活變化,迅速適應低延遲場景,提升視覺體驗。
可讓單一工作站無縫擴展桌面與應用程式至最多 4 張 GPU 與 16 個顯示器,同時提供完整效能與卓越畫質。支援解析度:Windows 最高 16K x 16K 或 Linux 最高 32K x 32K 。Mosaic 技術可與 RTX PRO Sync 結合,確保此配置下的顯示器同步運行。
透過專用連接埠,直接同步 3D 立體硬體與 NVIDIA RTX PRO 顯示卡,實現強大且精確的立體效果控制。
NVIDIA App 為您的桌面工作站提供一套生產力工具,包括最高 8K 解析度的桌面錄製、最新 NVIDIA RTX Enterprise 驅動程式更新的自動提醒,以及遊戲功能存取。此應用程式可在 此處下載。
深度學習框架(如 Caffe2、MXNet、CNTK、TensorFlow 等)可顯著縮短訓練時間,並提升多節點訓練效能。GPU 加速庫(如 cuDNN、cuBLAS 和 TensorRT)可為深度學習推論與高效能運算(HPC)應用提供更高的效能。立即使用 NVIDIA AI Workbench,只需幾個點擊即可運行範例專案或建立自訂環境,並內建一鍵協作功能,方便團隊合作。當您準備部署時,NVIDIA AI Enterprise 提供大規模的企業級預訓練模型、工具與支援,適用於各種規模的 AI 部署。
可直接執行 C/C++、Fortran 等標準程式語言,以及 OpenCL、OpenACC、Direct Compute 等 API,加速光線追蹤、影片與影像處理、計算流體力學等技術運算。
GPUDirect for Video 透過避免不必要的系統記憶體複製與 CPU 負擔,加速 GPU 與視訊 I/O 裝置之間的通訊,提高數據傳輸效率。
最大化系統運行時間,無縫管理大規模部署,並遠端控制圖形與顯示設定,以提升運營效率。
1 原 NVIDIA Quadro Sync II,將於 2025 年 3 月 18 日起更名。
2 支援需求:需使用 Linux 作業系統與 NVIDIA RTX Enterprise Driver R387 或更新版本。若超過 4 張 GPU,需 NVIDIA SLI 認證系統。
3 NVIDIA App 統一整合 NVIDIA 控制面板 與 NVIDIA RTX Experience™ 應用程式。
GPU 架構 | NVIDIA Blackwell |
CUDA 平行處理核心 | 14,080 |
NVIDIA Tensor 核心 | 440 |
NVIDIA RT 核心 | 110 |
AI 效能1 | 2223 AI TOPS2 |
GPU 記憶體 | 48 GB GDDR7 with ECC |
記憶體介面 | 384-bit |
記憶體頻寬 | 1,344 GB/s |
最大功耗 | 300W |
多實例 GPU | 最高 2x 48GB 最高 1x 96GB |
繪圖匯流排 | PCI Express 5.0 x16 |
顯示連接器 | DP 2.1 (4) |
外形規格 | 4.4”高 x 10.5”長, 全高全長 雙插槽 |
產品重量 | 1.950 kg |
散熱方式 | 渦輪式主動風扇 |
NVIDIA® 3D Vision® 與 3D Vision Pro | 透過 3-pin Mini DIN 提供支援 |
顯示同步 | 與 NVIDIA RTX PRO Sync 相容 |
外部電源連接端子 | 1x PCIe CEM5 16-pin |
NVENC | NVDEC | JPEG | 3x | 3x | 1x |
1 峰值速率基於 GPU Boost 時脈
2 使用稀疏性功能的理論 FP4 TOPS