• 比較リストに追加する

NVIDIA L40S

  • NVIDIA Ada Lovelace GPU アーキテクチャ
  • メモリ:48GB GDDR6 (ECC内蔵)
  • CUDA コア: 18,176
  • RT コア: 142
  • Tensor コア: 568
  • 最大消費電力: 350W
  • 相互接続バス: PCIe 4.0 x16
  • サーマルソリューション: パッシブ
  • フォームファクター: フルハイト、フルレングス、2スロット
  • vGPU ソフトウェア サポート
  • ルート・オブ・トラストによるセキュアブート
  • NEBS 対応

NVIDIA L40S

データ センターの AI とグラフィックスで発揮される比類なきパフォーマンス。

最もパワフルな汎用 GPU

NVIDIA L40S GPU で画期的なマルチワークロード パフォーマンスをご体験ください。パワフルな AI コンピューティングとこのクラスで最高のグラフィックスとメディア高速化を組み合わせた L40S GPU は、生成 AI や LLM (大規模言語モデル) の推論とトレーニングから 3D グラフィックス、レンダリング、ビデオまで、次世代のデータ センター ワークロードにパワーを与えます。

NVIDIA Ada Lovelace アーキテクチャ採用

第 4 世代 Tensor コア

構造的なスパース性と最適化された TF32 形式のハードウェア サポートによる パフォーマンス向上で、AI とデータ サイエンス のモデル トレーニングが高速化します。AI で強化するグラフィックス機能を DLSS で加速させ、一部のアプリケーションで解像度を格段にアップさせます。

第 3 世代 RT コア

スループットとコンカレント レイトレーシングとシェーディング機能が強化され、レイトレーシングのパフォーマンスが向上し、製品設計や建築、エンジニアリング、建設のワークフローのレンダリングが高速化されます。実際に動作している実物のようなデザインをご覧ください。ハードウェアによりモーション ブラーを高速化し、驚異的なリアルタイム アニメーションを実現しています。

CUDA コア

単精度浮動小数点 (FP32) スループットの高速化と電力効率の向上により、3D モデル開発や CAE (Computer-Aided Engineering) シミュレーションなどのワークフローでパフォーマンスが大幅に向上します。混合精度ワークロード向けの拡張 16 ビット演算機能 (BF16) を使用。

Transformer エンジン

Transformer エンジンは AI パフォーマンスを劇的に加速し、トレーニングと推論の両方でメモリ使用率を改善します。Ada Lovelace の第 4 世代 Tensor コアのパワーを利用する Transformer エンジンは、Transformer アーキテクチャ ニューラル ネットワークの層をインテリジェントにスキャンし、FP8 と FP16 の精度を自動的に再構築してより高速な AI パフォーマンスを実現し、トレーニングと推論を加速します。

効率性とセキュリティ

L40S GPU は、24 時間 365 日稼動するエンタープライズ データ センター運用に最適化されており、最大限のパフォーマンス、耐久性、アップタイムを確保するために、NVIDIA によって設計、構築、テスト、サポートされています。L40S GPU は最新のデータ センター標準を満たし、NEBS (Network Equipment-Building System) レベル 3 に対応し、Root of Trust 技術によるセキュア ブートを備え、データ センターにさらなるセキュリティ層を提供します。

DLSS 3

L40S GPU は、NVIDIA DLSS 3 により超高速のレンダリングと滑らかなフレーム レートを可能にします。この画期的なフレーム生成技術は、Ada Lovelace アーキテクチャと L40S GPU のディープラーニングと最新のハードウェア イノベーション (第 4 世代 Tensor コアやオプティカル フロー アクセラレータなど) を活用し、レンダリング性能を高め、FPS (フレーム毎秒) を上げ、レイテンシを大幅に改善します。

ユニバーサルな性能

Tensor 性能

1,466 TFLOPS1

RT コア 性能

212 TFLOPS

単精度演算性能

91.6 TFLOPS

1ピーク レートは、GPU ブーストクロックに基づきます。

マルチワークロードの高速化

生成 AI

新しいサービス、インサイト、オリジナルコンテンツを開発します。

次世代の AI、グラフィックス、メディアの高速化機能を備えた L40S は、前世代の NVIDIA A40 と比較して最大 5 倍の推論性能と、NVIDIA HGX™ A100 の 1.2 倍の性能を実現します。‌画期的な性能と 48 ギガバイト (GB) のメモリ容量を備え、マルチモーダルの生成 AI ワークロードを高速化するのに理想的なプラットフォームです。

生成 AI の詳細を見る

LLM のトレーニングと推論

AI のトレーニングと推論のワークロードを高速化します。

FP8 をサポートする第 4 世代 Tensor コアは、卓越した AI コンピューティング パフォーマンスを提供し、最先端の LLM と生成 AI モデルのトレーニングと推論を高速化します。

NVIDIA AI 推論のメリットの利点を見る

レンダリングと 3D グラフィックス

NVIDIA RTX グラフィックスで忠実度の高いクリエイティブ ワークフローにパワーを与えます。

第 3 世代 RT コアは、前世代の最大 2 倍のリアルタイム レイトレーシング パフォーマンスを提供し、インタラクティブ レンダリングからリアルタイムの仮想制作まで、驚異的なビジュアル コンテンツと忠実度の高いクリエイティブ ワークフローの制作にパワーを与えます。

NVIDIA RTX テクノロジの詳細を見る

NVIDIA Omniverse

メタバース アプリケーションの作成および運用をします。

NVIDIA Omniverseは、次世代の産業デジタル化アプリケーションの接続、開発、運用を可能にします。パワフルな RTX グラフィックスと AI 機能を備えた L40S は、Omniverse で構築された Universal Scene Description (OpenUSD) ベースの 3D ワークフローとシミュレーション ワークフローに優れたパフォーマンスを提供します。

NVIDIA Omniverse の詳細を見る

アーキテクチャ NVIDIA Ada Lovelace
CUDA コア 18,176
Tensor コア 568
RT コア 142
FP32 (TF) 91.6
TF32 Tensor コア (TF) 183 I 366*
BFLOAT16 Tensor コア (TF) 362.05 I 733*
FP16 Tensor コア (TF) 362.05 I 733*
FP8 Tensor コア (TF) 733 I 1,466*
INT8 Tensor コア (TOPS) 733 I 1,466*
INT4 Tensor コア (TOPS) 733 I 1,466*
RT コア 性能 (TF) 209
メディア エンジン 3 NVENC (+AV1)
3 NVDEC
4 NVJPEG
GPU メモリ 48GB GDDR6
メモリ バンド幅 864GB/秒
メモリ インターフェイス 384-bit
マルチインスタンス GPU (MIG) サポート ×
vGPU サポート
NEBS 対応 Level 3
サーマル ソリューション パッシブ
ディスプレイ ポート DisplayPort 1.4a ×4
最大消費電力 350W
バス インターフェイス PCI-E 4.0 x16
フォームファクター

(H) 4.4 × (L) 10.5 インチ、デュアルスロット

* スパース性対応


  • 本サイトに掲載される製品の仕様および情報等は、改良のため予告なしに変更される場合がございます。本サイトに掲載される製品の写真等は、実際の製品と異なる場合がございます。
  • 本サイトに掲載される製品仕様は参照のためだけのもので、実際の製品仕様は、実製品に依存します。そして、Leadtekはいつでも予告なしに内容の変更、または改訂する権利を保有します。販売されている国により、製品内容/仕様が違う場合がございます。実製品情報は、販売代理店へご確認ください。
  • 本サイトに掲載される、アダプター、ケーブル、およびソフトウェアは、参照のためだけのものです。そして、Leadtekはいつでも予告なしに内容を変更する権利を保有します。
  • 本サイトに掲載される会社名、商品名、およびロゴは各社の商標または登録商標です。