アナリティクス(分析)、人工知能(AI)、ハイパフォーマンス・コンピューティング(HPC)アプリケーションの爆発的な普及は、次の産業革命の原動力となり、クリエイティブ・ワーカーやナレッジ・ワーカーが最大の課題を克服する方法を変革しています。これらの課題を解決するには、次世代アプリケーションの開発と導入を加速し、大規模な導入プロセスを簡素化できる強力なソフトウェアとハードウェアのプラットフォームが必要です。
NVIDIA A800 40GB Active GPUは、NVIDIA Ampereアーキテクチャを搭載し、ワークステーション向けにかつてないコンピュート・アクセラレーションを実現し、次世代のデータサイエンス、データ分析、AI、HPCアプリケーションの開発と展開を加速する強力なパフォーマンスを提供します。ITおよびクリエイティブのプロフェッショナルは、A800 40GB Activeを搭載した高性能ワークステーション・プラットフォームを活用することで、一度開発すればどこにでも展開できるため、大規模なデータセットから洞察を導き出し、AIを強化したアプリケーションやモデルを構築、反復、改良し、最も要求の厳しい計算問題に取り組み、規模に応じた展開を簡素化することができます。A800 40GB Activeを搭載したワークステーション・プラットフォーム上のスーパーコンピューティング・パワーは、NVIDIAのGPUに最適化されたデータサイエンス、AI、HPCソフトウェア・プラットフォームと組み合わされ、共通のフレームワークを使用して一度構築すれば、どこでもスケーラブルに展開できるため、希少なデータセンターのリソースを節約することができます。
ワークロードの複雑性、データサイズの増加、そして生成AIのような新たなワークロードの急増は、コンピューティングの新時代を切り開き、科学的発見を加速し、生産性を向上させ、コンテンツ制作に革命をもたらしています。モデルのサイズと複雑さが爆発的に増大し、次のレベルの課題に挑み続ける中、ますます多くのワークロードがローカルデバイス上で実行される必要があります。次世代ワークステーション・プラットフォームは、これらの複雑なワークロードをサポートするハイパフォーマンス・コンピューティング機能を提供する必要があります。
NVIDIA A800 40GB Active GPUは、データサイエンス、AI、HPCワークフローを432個の第3世代Tensorコアで加速し、AIパフォーマンスと超高速かつ効率的な推論機能を最大化します。第3世代のNVIDIA® NVLink®テクノロジーを搭載したA800 40GB Activeは、重いAIワークロードに対してスケーラブルなパフォーマンスを提供し、有効なメモリフットプリントを2倍にし、最大400ギガバイト/秒(GB/s)の双方向帯域幅でGPU間のデータ転送を可能にします。
企業における AI の導入は現在主流となっており、熟練した AI 開発者やデータ サイエンティストの需要が高まっています。組織は、生産性を最大化し、AI 開発を加速するために、最適化されたハードウェアとソフトウェアで構成される柔軟で高性能なプラットフォームを必要としています。
開発者ワークステーション用のNVIDIA A800 40GB Active GPUには、NVIDIA AI Enterpriseソフトウェアが含まれており、クラス最高のAIツールとエンタープライズグレードのセキュリティとサポートでAI開発を強化します。
NVIDIA AI Enterpriseは、エンドツーエンドのエンタープライズグレードのAIソフトウェアプラットフォームであり、100以上のフレームワーク、事前学習済みモデル、およびライブラリを提供し、生成AI、コンピュータビジョン、および音声AIを含むプロダクションAIの開発と展開を合理化します。ワークステーションでもデータセンターでも、信頼できるパフォーマンスを発揮できるように最適化され、認定されたNVIDIA AI Enterpriseは、アプリケーションを一度開発すれば、どこにでも展開できる統合プラットフォームを提供し、試験運用から本番運用への移行に伴うリスクを軽減します。NVIDIA AI Enterpriseは、NVIDIA A800 40GBアクティブGPUとともに、データサイエンス、トレーニング、推論において最高のパフォーマンスを提供します。
A800 40GB Activeは、TensorコアのパワーをHPCにもたらし、HPCに倍精度GPUコンピューティングを導入して以来、最大のマイルストーンを提供します。A800 40GB Active GPUに搭載された第3世代のTensorコアは、IEEE準拠の完全なFP64精度での行列演算を可能にします。倍精度(FP64)の毎秒9.7テラ浮動小数点演算(TFLOPS)、単精度(FP32)の毎秒19.5テラ浮動小数点演算(TFLOPS)、半精度(FP16)の毎秒78テラ浮動小数点演算(TFLOPS)、整数精度(INT8)の毎秒1247テラ浮動小数点演算(TOPS)、テンソル演算の毎秒624テラ浮動小数点演算(TFLOPS)を備えたA800 40GB Activeは、幅広い計算負荷に完璧に対応します。
ディスプレイ機能をサポートし、ビジュアルアプリケーション向けに高性能グラフィックスを提供するために、NVIDIA A800 40GB Activeのコンピューティング機能は、NVIDIA RTX™アクセラレートGPUと組み合わせるように設計されています。NVIDIA RTX A4000およびT1000 GPUは、A800 40GB Activeと同時に動作することが認定されており、シングルスロットのフォームファクタで強力なリアルタイムレイトレーシングとAIアクセラレーショングラフィックス性能を提供します。
強力なパフォーマンスでエンドツーエンドのデータサイエンスとアナリティクスのワークフローを加速し、大規模なデータセットから意味のある洞察を迅速に引き出します。A800 40GB Activeの高性能コンピューティング機能とNVIDIA AI Enterpriseを組み合わせることで、データ担当者は、ライブラリ、ツール、テクノロジーの大規模なコレクションを活用し、データ準備、トレーニングから推論に至るまで、データサイエンスのワークフローを加速することができます。
40GBのHBM2メモリと、前世代の最大2倍の性能を実現する強力な第3世代Tensorコアを搭載したA800 40GB Active GPUは、データの準備と処理、モデルの最適化とチューニング、初期段階のトレーニングなど、ワークステーション・プラットフォーム上で要求の厳しいAI開発とトレーニングのワークフローを克服するための驚異的な性能を提供します。
NVIDIA AI Enterpriseソフトウェア・プラットフォームは、大規模なAIの展開を加速し、簡素化します。この強力なソフトウェア・プラットフォームとA800 40GB Active GPUを組み合わせることで、AI開発者は、付属のフレームワークを使用してワークステーション上でAIモデルを構築、反復、改良することができ、スケーリング・プロセスを簡素化し、より高価で大規模な計算のために高価なデータセンターのコンピューティング・リソースを確保することができます。
推論ではAIが結果を提供し、トレーニングされたモデルを運用することで実用的な洞察を提供します。432個の第3世代Tensorコアと6,912個のCUDA®コアを搭載したA800 40GB Activeは、構造的なスパース性とTF32、INT8、FP64を含む幅広い精度をサポートすることで、前世代と比較して2倍の推論演算性能を実現します。AI開発者は、NVIDIA AI Enterpriseの一部であるNVIDIA TensorRT™、NVIDIA Triton™ Inference Server、NVIDIA Triton™ Management Serviceを含むNVIDIA推論ソフトウェアを使用することで、大規模なAIモデルの展開を簡素化し、最適化することができます。
既存のデータ内のパターンや構造を識別するためにニューラルネットワークを使用することで、生成AIアプリケーションは、画像、サウンド、アニメーション、3Dモデルなどの多種多様な入力や出力から、新しいオリジナルコンテンツを生成することを可能にします。NVIDIA A800 40GB Active GPUとともにNVIDIA AI Enterpriseに含まれるNVIDIA生成AIソリューション、NeMo™ Frameworkを活用することで、簡単、高速、カスタマイズ可能な生成 AI モデル開発を実現します。
A800 40GBアクティブGPUは、GPUアクセラレーションによるコンピュータ支援エンジニアリング(CAE)アプリケーションで驚異的なパフォーマンスを発揮します。エンジニアリングや製品開発のプロフェッショナルは、有限要素解析(FEA)、数値流体力学(CFD)、建設工学管理(CEM)、およびその他のエンジニアリング解析コードの大規模シミュレーションを、FP64フル精度で驚異的なスピードで実行することができ、開発期間を短縮し、価値実現までの時間を短縮します。表示機能を提供するRTXアクセラレーテッドGPUの追加により、科学者やエンジニアは、大規模シミュレーションやモデルを完全な設計忠実度で視覚化できます。
9.7TFLOPSのFP64演算性能を持つA800 40GB Active GPUにより、地球科学の専門家は、最新のAIを活用した探査・生産ソフトウェアのワークフローを強化し、シミュレーション・プロセスを高速化することで、地下データをより迅速に把握することができます。大規模なデータセットの場合、2つのA800 40GB Active GPUをNVLinkで接続して、80GBのメモリと2倍の処理能力を提供することができます。
A800 40GB を使用すると、ライフ サイエンス分野のアクティブな専門家が複雑なデータ処理タスクを加速し、より迅速な発見を可能にし、意思決定を向上させることができます。ゲノミクスシークエンシング、医療画像処理、個別化医療などの AI を活用したライフ サイエンス アプリケーションは、トレーニングと推論のパフォーマンスの高速化による恩恵を受けて、大規模なデータセットの分析を加速できます。高精度を必要とする複雑なシミュレーションやデータ処理タスクの場合、FP64 機能により、分子動力学、創薬、ゲノム分析などの科学アプリケーションをより高い精度と精度で実行できるようになり、より信頼性の高い結果が得られます。
メモリ
アーキテクチャ | NVIDIA Ampere |
CUDA コア | 6912 |
Tensor コア | 432 |
GPU メモリ | 40 GB HBM2 |
ピーク倍精度演算性能 (FP64) | 9.7 TFLOPS |
FP64 Tensor コア 性能 | 19.5 TFLOPS |
ピーク単精度演算性能 (FP32) | 19.5 TFLOPS |
Tensor Float 32 (TF32) Tensor コア 性能 | 311.8 TFLOPS |
ピーク半精度演算性能 (FP16) | 78.0 TFLOPS |
BFLOAT16 Tensor コア 性能 | 623.8 TFLOPS |
ピーク Integer Operation (INT8) 性能 | 1247.4 TOPS |
ピーク Tensor Operation 性能1 | 623.8 TFLOPS |
メモリ インターフェイス | 5120-bit |
メモリ 帯域幅 | 1555.2 GB/s |
最大消費電力 | 240W |
サーマルソリューション | ブロワー アクティブ ファン |
Multi-Instance GPU(MIG) |
最大 7 MIGs @5GB |
グラフィックスバス | PCIe 4.0 x16 |
外部出力 |
本製品には、外部出力用コネクタは切搭載しておりません。 |
フォームファクター | (H) 4.4” x (L) 10.5” 、デュアルスロット |
重量 | 1181.9g |
vGPU Software サポート2 | NVIDIA vPC/vApps、NVIDIA RTX Virtual Workstation (vWS) |
vGPU Profiles サポート | 4GB、5 GB、8GB、10GB、20GB、40GB |
NVLink | 2ウェイ・ロープロファイル(2スロットおよび3スロット・ブリッジ) A800 40GBアクティブ ×2 |
NVLink インターコネクト | 400 GB/s (双方向) |
サーバー オプション | 1~8GPUを搭載した NVIDIA Certified Systems™ |
NVIDIA AI Enterprise | 含む 3 |
電源コネクタ | PCIe CEM5 16ピン ×1 |
NVDEC | 5x デコード |
1FP16またはFP32アキュムレートによるFP16行列乗算
2A800 40GB Activeの仮想化サポートは、2023年第3四半期に予定されているNVIDIA仮想GPU(vGPU)リリースで利用可能になる予定です。
3NVIDIA AI Enterpriseライセンスの3年間のソフトウェア・サブスクリプションとエンタープライズ・サポート。アクティベーションが必要です。