データ センターの AI とグラフィックスで発揮される比類なきパフォーマンス。
NVIDIA L40S GPU で画期的なマルチワークロード パフォーマンスをご体験ください。パワフルな AI コンピューティングとこのクラスで最高のグラフィックスとメディア高速化を組み合わせた L40S GPU は、生成 AI や LLM (大規模言語モデル) の推論とトレーニングから 3D グラフィックス、レンダリング、ビデオまで、次世代のデータ センター ワークロードにパワーを与えます。
構造的なスパース性と最適化された TF32 形式のハードウェア サポートによる パフォーマンス向上で、AI とデータ サイエンス のモデル トレーニングが高速化します。AI で強化するグラフィックス機能を DLSS で加速させ、一部のアプリケーションで解像度を格段にアップさせます。
スループットとコンカレント レイトレーシングとシェーディング機能が強化され、レイトレーシングのパフォーマンスが向上し、製品設計や建築、エンジニアリング、建設のワークフローのレンダリングが高速化されます。実際に動作している実物のようなデザインをご覧ください。ハードウェアによりモーション ブラーを高速化し、驚異的なリアルタイム アニメーションを実現しています。
単精度浮動小数点 (FP32) スループットの高速化と電力効率の向上により、3D モデル開発や CAE (Computer-Aided Engineering) シミュレーションなどのワークフローでパフォーマンスが大幅に向上します。混合精度ワークロード向けの拡張 16 ビット演算機能 (BF16) を使用。
Transformer エンジンは AI パフォーマンスを劇的に加速し、トレーニングと推論の両方でメモリ使用率を改善します。Ada Lovelace の第 4 世代 Tensor コアのパワーを利用する Transformer エンジンは、Transformer アーキテクチャ ニューラル ネットワークの層をインテリジェントにスキャンし、FP8 と FP16 の精度を自動的に再構築してより高速な AI パフォーマンスを実現し、トレーニングと推論を加速します。
L40S GPU は、24 時間 365 日稼動するエンタープライズ データ センター運用に最適化されており、最大限のパフォーマンス、耐久性、アップタイムを確保するために、NVIDIA によって設計、構築、テスト、サポートされています。L40S GPU は最新のデータ センター標準を満たし、NEBS (Network Equipment-Building System) レベル 3 に対応し、Root of Trust 技術によるセキュア ブートを備え、データ センターにさらなるセキュリティ層を提供します。
L40S GPU は、NVIDIA DLSS 3 により超高速のレンダリングと滑らかなフレーム レートを可能にします。この画期的なフレーム生成技術は、Ada Lovelace アーキテクチャと L40S GPU のディープラーニングと最新のハードウェア イノベーション (第 4 世代 Tensor コアやオプティカル フロー アクセラレータなど) を活用し、レンダリング性能を高め、FPS (フレーム毎秒) を上げ、レイテンシを大幅に改善します。
1,466 TFLOPS1
212 TFLOPS
91.6 TFLOPS
次世代の AI、グラフィックス、メディアの高速化機能を備えた L40S は、前世代の NVIDIA A40 と比較して最大 5 倍の推論性能と、NVIDIA HGX™ A100 の 1.2 倍の性能を実現します。画期的な性能と 48 ギガバイト (GB) のメモリ容量を備え、マルチモーダルの生成 AI ワークロードを高速化するのに理想的なプラットフォームです。
FP8 をサポートする第 4 世代 Tensor コアは、卓越した AI コンピューティング パフォーマンスを提供し、最先端の LLM と生成 AI モデルのトレーニングと推論を高速化します。
第 3 世代 RT コアは、前世代の最大 2 倍のリアルタイム レイトレーシング パフォーマンスを提供し、インタラクティブ レンダリングからリアルタイムの仮想制作まで、驚異的なビジュアル コンテンツと忠実度の高いクリエイティブ ワークフローの制作にパワーを与えます。
NVIDIA Omniverse™は、次世代の産業デジタル化アプリケーションの接続、開発、運用を可能にします。パワフルな RTX グラフィックスと AI 機能を備えた L40S は、Omniverse で構築された Universal Scene Description (OpenUSD) ベースの 3D ワークフローとシミュレーション ワークフローに優れたパフォーマンスを提供します。
アーキテクチャ | NVIDIA Ada Lovelace |
CUDA コア | 18,176 |
Tensor コア | 568 |
RT コア | 142 |
FP32 (TF) | 91.6 |
TF32 Tensor コア (TF) | 183 I 366* |
BFLOAT16 Tensor コア (TF) | 362.05 I 733* |
FP16 Tensor コア (TF) | 362.05 I 733* |
FP8 Tensor コア (TF) | 733 I 1,466* |
INT8 Tensor コア (TOPS) | 733 I 1,466* |
INT4 Tensor コア (TOPS) | 733 I 1,466* |
RT コア 性能 (TF) | 209 |
メディア エンジン | 3 NVENC (+AV1) 3 NVDEC 4 NVJPEG |
GPU メモリ | 48GB GDDR6 |
メモリ バンド幅 | 864GB/秒 |
メモリ インターフェイス | 384-bit |
マルチインスタンス GPU (MIG) サポート | × |
vGPU サポート | 〇 |
NEBS 対応 | Level 3 |
サーマル ソリューション | パッシブ |
ディスプレイ ポート | DisplayPort 1.4a ×4 |
最大消費電力 | 350W |
バス インターフェイス | PCI-E 4.0 x16 |
フォームファクター |
(H) 4.4 × (L) 10.5 インチ、デュアルスロット |
* スパース性対応