新興分析、人工智慧 (AI) 和高效能運算 (HPC) 應用的爆炸性成長正在推動下一次工業革命,並改變創意和知識工作者克服最大挑戰的方式。解決這些挑戰需要強大的軟體和硬體平台,可以加速下一代應用程式的開發和部署,並簡化大規模部署的流程。
NVIDIA A800 40GB Active GPU 採用 NVIDIA Ampere 架構,可為工作站提供前所未有的運算加速,提供強大的效能來加速下一代資料科學、資料分析、AI 和 HPC 應用程式的開發和部署。透過使用通用框架一次開發、隨處部署,IT 和創意專業人士可以利用由A800 40GB Active 提供支援的高效能工作站平台,從大型資料集中獲取見解,建構、迭代和完善人工智慧增強應用程式和模型,解決最棘手的問題。要求苛刻的計算問題,並簡化大規模部署。A800 40GB Active 工作站平台上的超級運算能力與 NVIDIA GPU 優化的資料科學、人工智慧和 HPC 軟體平台相結合,透過使用通用框架一次建置並在任何地方大規模部署來保留稀缺的資料中心資源。
工作負載複雜性、資料大小的成長以及新興工作負載的激增,例如生成式人工智慧正在開創運算的新時代,加速科學發現,提高生產力,並徹底改變內容創作。隨著模型的規模和複雜性不斷激增以應對新等級的挑戰,越來越多的工作負載需要在本地設備上運作。下一代工作站平台需要提供高效能運算能力來支援這些複雜的工作負載。
NVIDIA A800 40GB Active GPU 利用 432 個第三代 Tensor Core 加速資料科學、AI 和 HPC 工作流程,最大限度地提高 AI 效能和超快速高效的推論能力。 憑藉第三代 NVIDIA® NVLink® 技術,A800 40GB Active 為繁重的 AI 工作負載提供可擴展的效能,使有效記憶體佔用量加倍,並使 GPU 到 GPU 的資料傳輸雙向頻寬高達每秒 400 GB。
企業採用人工智慧現已成為主流,導致對熟練人工智慧開發人員和資料科學家的需求增加。 組織需要一個由最佳化的硬體和軟體組成的靈活的高性能平台,以最大限度地提高生產力並加速人工智慧開發。適用於開發人員工作站的 NVIDIA A800 40GB 主動 GPU 包括 NVIDIA AI Enterprise 軟體,透過一流的 AI 工具以及企業級安全性和支援來增強 AI 開發。
NVIDIA AI Enterprise 是一個端到端的企業級 AI 軟體平台,提供 100 多個框架、預訓練模型和函式庫,以簡化生產 AI 的開發和部署,包括產生 AI、電腦視覺和語音 AI。無論是部署在工作站還是資料中心,NVIDIA AI Enterprise 都經過最佳化和認證,可提供可靠的效能,提供統一的平台,一次開發應用程式即可在任何地方部署,從而降低從試點轉向生產所涉及的風險。NVIDIA AI Enterprise 與 NVIDIA A800 40GB Active GPU 相結合,可在資料科學、訓練和推論方面提供開箱即用的最高效能。
A800 40GB Active 將 Tensor Core 的強大功能導入 HPC,這是自 HPC 使用雙精度 GPU 運算以來的最大里程碑。A800 40GB Active GPU 中的第三代 Tensor Core 可實現完全符合 IEEE 的 FP64 精度的矩陣運算。 雙精度 (FP64) 每秒超過 9.7 兆次浮點運算 (TFLOPS)、單精度 (FP32) 超過 19.5 TFLOPS、半精度 (FP16) 超過 78 TFLOPS、整數精度每秒超過 1247 兆次運算 (TOPS) (INT8) 和624 TFLOPs Tensor 運算能力,A800 40GB Active 完美支援各種運算密集型工作負載。
為了支援顯示功能並為視覺應用程式提供高效能繪圖,NVIDIA A800 40GB Active 的運算能力旨在與 NVIDIA RTX™ 加速 GPU 搭配使用。NVIDIA RTX A4000 和 T1000 GPU 均經過認證,可與 A800 40GB Active 協同運行,以單插槽外形提供強大的即時光線追蹤和 AI 加速繪圖效能。
憑藉強大的效能加速端到端資料科學和分析工作流程,快速從大規模資料集中提取有意義的見解。 透過將 A800 40GB Active 的高效能運算功能與 NVIDIA AI Enterprise 結合,資料從業者可以利用大量函式庫、工具和技術來加速資料科學工作流程 - 從資料準備和訓練到推論。
A800 40GB Active GPU 配備40GB HBM2 記憶體和強大的第三代Tensor Core,效能高達上一代的2 倍,可提供令人難以置信的效能,以應對工作站平台上要求苛刻的AI 開發和訓練工作流程,包括資料準備和處理、模型最佳化和調整以及早期訓練。
NVIDIA AI Enterprise 軟體平台可加速並簡化 AI 的大規模部署,讓組織能夠一次開發,隨處部署。 將此強大的軟體平台與A800 40GB Active GPU 相結合,使AI 開發人員能夠使用隨附的框架在工作站上建立、迭代和完善AI 模型,進而簡化擴展過程並保留高昂的資料中心運算資源,以進行更昂貴的大規模計算。
推論是人工智慧提供結果的地方,透過操作訓練有素的模型來提供可行的見解。 A800 40GB Active 擁有 432 個第三代 Tensor 核心和 6,912 個 CUDA® 核心,推論運算效能是上一代產品的 2 倍,並支援結構稀疏性和廣泛的精度,包括 TF32、INT8 和 FP64。 AI 開發人員可以使用 NVIDIA 推論軟體(包括 NVIDIA TensorRT™、NVIDIA Triton™ 推論伺服器和 NVIDIA Triton™ 管理服務)(這些軟體是 NVIDIA AI Enterprise 的一部分)來大規模簡化和最佳化 AI 模型的部署。
生成式 AI 使用神經網路識別現有資料中的模式和結構,使用戶能夠從各種輸入和輸出(包括圖像、聲音、動畫和 3D 模型)生成新的原創內容。 利用 NVIDIA AI Enterprise 中包含的 NVIDIA 生成式 AI 解決方案 NeMo™ Framework 以及 NVIDIA A800 40GB Active GPU,實現輕鬆、快速且可自訂的生成式 AI 模型開發。
A800 40GB Active 為 GPU 加速的電腦輔助工程 (CAE) 應用程式提供令人難以置信的效能。 工程和產品開發專業人員可以以令人難以置信的速度,以全FP64 精度運行有限元素分析(FEA)、計算流體動力學(CFD)、建築工程管理(CEM) 和其他工程分析程式碼的大規模擬,進而縮短開發時間並加速實現價值的時間。 透過搭配提供顯示功能的 RTX GPU,科學家和工程師可以以完全設計擬真度視覺化大規模模擬和模型。
A800 40GB Active 具有 9.7 TFLOPS 的 FP64 運算效能,使地球科學專業人員能夠為最新的人工智慧增強勘探和生產軟體工作流程提供支持,並加速模擬過程,而能更快地洞察地下資料。 對於大規模資料集,可以透過 NVLink 橋接器連接兩個 A800 40GB Active ,提供 80GB 記憶體和兩倍的處理能力。
借助 A800 40GB Active,生命科學學科的專業人員可以加速複雜的資料處理任務,實現更快的探索結果並改善決策。 基因組定序、醫學影像和個人化醫療等人工智慧加速的生命科學應用可以受益於更快的訓練和推論效能,進而加速大型資料集的分析。 對於需要高精度的複雜模擬和數據處理工作,FP64 功能允許分子動力學、藥物開發和基因組分析等科學應用,以更高的準確度和精度運行,進而產生更可靠的結果。
GPU 架構 | NVIDIA Ampere |
CUDA 平行處理核心 | 6912 |
Tensor 核心 | 432 |
GPU 記憶體 | 40 GB HBM2 |
雙精度峰值 (FP64) 效能 | 9.7 TFLOPS |
FP64 Tensor 核心效能 | 19.5 TFLOPS |
單精度峰值 (FP32) 效能 | 19.5 TFLOPS |
Tensor Float 32 (TF32) Tensor 核心效能 | 311.8 TFLOPS |
半精度峰值 (FP16) 效能 | 78.0 TFLOPS |
BFLOAT16 Tensor 核心效能 | 623.8 TFLOPS |
整數運算峰值 (INT8) 效能 | 1247.4 TOPS |
Tensor 運算峰值效能1 | 623.8 TFLOPS |
記憶體介面 | 5120-bit |
記憶體頻寬 | 1555.2 GB/s |
最大功耗 | 240W |
散熱方式 | 主動式風扇 |
多執行個體GPU (MIG) | 最高達 7 MIGs @5GB |
繪圖匯流排 | PCIe 4.0 x16 |
顯示連接器 | 不支援 |
尺寸 | 4.4” H x 10.5” L 雙插槽 |
產品重量 | 1181.9g |
支援 vGPU 軟體2 | NVIDIA vPC/vApps, NVIDIA RTX 虛擬工作站 (vWS) |
支援 vGPU 模式 | 4GB, 5 GB, 8GB, 10GB, 20GB, 40GB |
NVLink | 兩路低結構造型 (雙插槽與三插槽橋接器)可連接 2片 A800 40GB Active |
NVLink 互連技術 | 400 GB/s (雙向) |
伺服器選項 | NVIDIA Certified Systems™ (1-8 GPUs) 認證系統 |
NVIDIA AI Enterprise | 內含3 |
外部電源連接器 | 1x PCIe CEM5 16-pin |
NVDEC | 5x 解碼 |
1FP16 矩陣乘以 FP16 或 FP32 累加
2對 A800 40GB Active 的虛擬化支援將在即將發布的 NVIDIA 虛擬 GPU (vGPU) 版本中提供,預計將於 2023 年第三季發布。
3NVIDIA AI Enterprise 授權的 3 年軟體訂閱和企業支援。 軟體授權需啟用。