NVIDIA RTX PRO™ 4500 Blackwell 伺服器版本 GPU 採用革命性 NVIDIA Blackwell 架構,是一款節能的多工作負載加速器,旨在為各種企業工作負載提供突破性的效能,包括 AI 推論、資料科學與處理,以及影像與高階視覺運算。
RTX PRO 4500 Blackwell 採用節能的 165 W 單插槽外形規格,可為資料中心、邊緣與雲端部署提供靈活的功能與強大的加速功能。
高能效的 NVIDIA Blackwell 效能,適用於任何企業工作負載。
利用 RTX PRO 4500 Blackwell 伺服器版本,將大量、零散且多模態的企業資料轉化為 AI 就緒資料。 利用 cuVS 為現有資料庫與向量搜尋函式庫加速並最佳化向量索引建立與向量搜尋應用,效能最高可達僅使用 CPU 的系統的 50 倍。
RTX PRO 4500 Blackwell GPU 搭載第五代 Tensor 核心與 32 GB GDDR7 記憶體,搭配 NVIDIA Metropolis 與 CV-CUDA 平台,可讓視覺 AI 應用與影像內容理解效能提升至新的高度。 相較於僅有 CPU 的系統,RTX PRO 4500 Blackwell 伺服器版本可為 AI 影像理解提供最高 100 倍的效能,讓企業能夠即時獲得深入解析,並加速從邊緣到資料中心的智慧視覺應用。
隨著資料處理與 AI 影像理解的指數級增長,基礎架構的效率變得至關重要。 RTX PRO 4500 Blackwell 伺服器版本可在效能與能源效率方面實現令人難以置信的飛躍,相較於僅使用 CPU 的系統,效能最高可達 100 倍,而且伺服器佔用空間與能源消耗可降低 95% 以上。
特色
採用 NVIDIA Blackwell 架構
第五代 Tensor 核心效能是前一代的 3 倍,新增對 FP4 精度和 DLSS 4 多畫格生成技術的支援。加速代理式與生成式 AI 應用,並推動強化內容創作與圖形效能。
第四代 RT 核心效能高達前一代的 2 倍,可讓媒體與娛樂業的內容創作、AECO 設計,以及製造業原型設計加快渲染速度。利用神經圖形技術(例如 RTX™ Mega Geometry)創建逼真的、符合物理學要求的精確場景與沉浸式 3D 設計,並能實現最高 100 倍的光線追蹤三角形。
NVIDIA Blackwell 採用最新的串流多處理器(SM)與 CUDA® 核心技術,是有史以來創造出最強大的專業 RTX GPU。SM 具有更高的處理傳輸量,並採用新的神經著色器,將神經網路整合至可程式化的著色器中,以推動未來十年的 AI 增強圖形創新。
全新改良的 GDDR7 記憶體大幅提升了頻寬與容量,讓應用程式運作速度加快,可處理更大且更複雜的資料集。利用 32GB GPU 記憶體,可應對更大的 AI 模型、更大的資料集,以及複雜的創意工作流程。
第九代 NVIDIA NVENC 引擎可大幅加速影片編碼速度,並提升專業級影片應用的影像品質。新增 4:2:2 H.264 與 HEVC 編碼支援,並進一步提升 HEVC 和 AV1 的編碼品質。
第六代 NVIDIA NVDEC 引擎提供高達 2 倍的 H.264 解碼傳輸量,並且支援 4:2:2 H.264 和 HEVC 解碼。專業人士可享受高品質影片播放、加速影片資料匯入流程,並運用進階的 AI 影片編輯功能。
多執行個體 GPU (MIG) 可擴展 RTX PRO 4500 Blackwell 的效能與價值,可建立最多兩 (2) 個完全隔離的 16 GB 執行個體。每個 MIG 執行個體都有自己的高頻寬記憶體、快取和運算核心,以及保證服務品質 (QoS),讓加速運算資源的覆蓋範圍拓展到每位使用者。
支援 PCI Express Gen 5,頻寬為 PCIe Gen 4 的兩倍,提升 CPU 記憶體的資料傳輸速度,為 AI、資料科學和 3D 模型等資料密集型任務解鎖更快效能。
工作負載
高效的多工作負載效能
RTX PRO 4500 Blackwell 為資料處理工作負載提供領先的效能與效率,包括大數據分析、機器學習、圖形處理,以及各產業 AI 應用的向量搜尋。憑藉第五代 Tensor 核心、32 GB 的超高速記憶體、800 GB/s 的頻寬,以及搭配 NVIDIA CUDA-X™ 函式庫,資料專業人員可運用最受歡迎的資料科學 Python 函式庫,為大規模資料查詢與 ML 工作流程釋放頂尖效能。
從邊緣到資料中心,解鎖突破性的效能,並無縫部署視覺 AI 代理與智慧影像分析應用。在 NVIDIA VSS 藍圖與 NVIDIA Cosmos™ Reason 等 VLM 的驅動下,視覺 AI 代理可將原始影片轉化為豐富且可付諸行動的深入解析。RTX PRO 4500 Blackwell GPU 搭載第五代 Tensor 核心、支援 FP4 精度、32GB GDDR7 記憶體,搭配 NVIDIA Metropolis 函式庫,可簡化從邊緣部署到雲端的視覺 AI 代理的開發、部署與擴充性。
RTX PRO 4500 Blackwell 可為中小型多模態模型與語言模型提供加速效能與效率。 它搭載第五代 Tensor 核心,支援 FP4 精度、NVIDIA 最佳化的推論框架,以及 NIM™ 微服務,其效能是上一代 L4 GPU 的 5 倍以上。利用 NVIDIA Nemotron™ 系列開放式模型、資料集與技術,在 RTX PRO 4500 Blackwell 上建構並部署準確且高效率的代理 AI 應用程式,以處理包括推理、視覺、檢索增強生成 (RAG)、語音與安全等領域的一系列任務。
透過最新一代的 RTX 技術、三個影像編碼和三個影像解碼引擎,實現全新的工作流程並獲得全新的創意能力。RTX PRO 4500 Blackwell 可確保順暢的影像串流效能,並支援最新一代 AV1 編碼和解碼格式,徹底革新內容在直播媒體、遊戲開發、電影與電視中創造、管理、發佈與消費的方式。解鎖更高的串流密度與更高的解析度,在部署影像應用時提供更優異的客戶體驗。
RTX PRO 4500 Blackwell 伺服器版本透過新一代 RTX 功能,強化 AI 驅動的內容創作與視覺運算工作流程,徹底革新採用 AI 技術的渲染與圖形處理。 RTX 神經著色器利用 AI 將複雜的照明與紋理生成自動化,Blackwell Tensor 核心為生成式 AI 內容創建提供強大的效能,而 DLSS 4 則透過採用 AI 技術的即時擬真渲染技術,提升效能與視覺擬真度。這些進展可加速 3D 建模、動畫和虛擬製作,為電影、遊戲和建築視覺化等產業提供動力,實現絕佳的細緻度和效率。
當與 NVIDIA RTX Virtual Workstation (vWS) 與 NVIDIA Virtual PC (vPC) 軟體結合使用時,RTX PRO 4500 Blackwell 可實現虛擬化,為遠端使用者提供用於高端設計、AI 與知識工作者工作負載的高效能執行實例,並可透過最佳方式將 GPU 資源分配給最需要的地方,從而最大化 GPU 利用率。NVIDIA 虛擬 GPU 軟體支援 MIG 支援的時間切片技術,可提供多租戶功能,並提升效能與效率,同時執行 AI 與圖形工作負載。
優勢
強大、小巧且可滿足多工作負載效能
RTX PRO 4500 Blackwell 伺服器版本提供 Blackwell 級效能,採用 165 W 單插槽小巧外形規格,非常適合主流企業資料中心與邊緣平台。
RTX PRO 4500 Blackwell 搭載第五代 Tensor 核心、第四代 RT 核心,以及 32 GB 的高速 GDDR7 記憶體,可為資料處理、AI 與影像,以及視覺運算等各種企業工作負載提供突破性的效能。
RTX PRO 4500 Blackwell 可加速 NVIDIA 軟體的完整堆疊,可用於多種合作夥伴系統,並通過頂尖工具與應用程式驗證,作為 NVIDIA AI 工廠驗證設計的一環,可確保高效能、可靠性與擴充性。
解決方案
NVIDIA Enterprise AI Factory 驗證設計可提供指引,幫助您在本地 NVIDIA Blackwell 平台上開發、部署與管理代理式 AI、物理 AI 與 HPC 工作負載。 這個架構專為企業 IT 設計,建議加速運算、網路、儲存裝置和軟體技術,以協助企業快速建置 AI 工廠並實現價值,同時降低導入風險。
Aerial RAN Computer (ARC) 系列為電信網路提供高效能的可擴充加速運算平台,實現商業 AI-RAN 部署。
ARC-Pro AI-RAN 平台搭載 RTX PRO 4500 Blackwell 伺服器版本,專為透過先進運算、連接與感測能力接軌 AI 原生 5G 與 6G 而設計。針對電信最佳化的外形規格,適用於現有站點升級或新建部署。
RTX PRO Blackwell GPU 是 NVIDIA AI 資料平台的關鍵基石,是一款新型 AI 基礎架構的可自訂參考設計,該架構整合了企業儲存裝置與 NVIDIA 加速運算技術,可透過近乎即時的商業深入解析來驅動 AI 代理。
NVIDIA RTX PRO 伺服器提供多種配置,搭載全球系統合作夥伴的 RTX PRO 資料中心 GPU,利用 NVIDIA Blackwell 架構的突破性效能與能效,讓企業能夠打造 AI 工廠並加速各種企業工作負載,包括代理式 AI 與 LLM 推論,以及工業級 AI 與數位孿生應用。
深入瞭解| GPU 架構 | NVIDIA Blackwell 架構 |
| CUDA 平行處理核心 | 10,496 |
| NVIDIA RT 核心 | 82 |
| FP4 Tensor 核心 | 1.6 PFLOPS |
| FP8 Tensor 核心 | 811 TFLOPS |
| FP16 | BF16 Tensor 核心 | 406 TFLOPS |
| TF32 Tensor 核心 | 203 TFLOPS |
| 單精度效能 (FP32) | 51 TFLOPS |
| 峰值 RTX 核心效能 | 154 TFLOPS |
| GPU 記憶體 | 32 GB GDDR7 |
| 記憶體介面 | 256-bit |
| 記憶體頻寬 | 800 GB/s |
| 功耗 | 165 W |
| 多執行個體 GPU | 最高 2 個 MIG @ 16 GB |
| NVENC | NVDEC | 3x l 3x |
| 機密運算 | 支援 |
| 互連技術 | PCI Express 5.0 x 16 |
| 外形規格 | 單插槽, 全高全長 (4.4" 高 x 10.5" 長) |
| 散熱方式 | 被動式 |
| 外部電源連接端子 | 1x PCIe CEM5 16-pin |
