NVIDIA® Quadro® GV100は、AIの強化された設計とビジュアライゼーションワークフローの要求を満たすためにワークステーションを刷新します。NVIDIA Voltaを搭載し、設計者、建築家、科学者がこれまで不可能だったものを創り、構築し、解決するために必要な、極限のメモリ容量、スケーラビリティ、パフォーマンスを提供します。
AIによるレンダリングをスーパーチャージ
● 完全な忠実度、大量のデータセットで作業
● AIによる加速型ノイズ除去機能および流動的なビジュアルインタラクティブ機能を実現
最適な設計を迅速に市場投入
● 忠実度の高いCAEシミュレーションモデルで作業
● より速いソルバー性能でより多くの設計オプションを探求
究極の没入感を体験
● VRで複雑なフォトリアルデータセットを使用
● 最適なNVIDIA Holodeck体験を楽しむ
AIで新しい機会を実現
● NVIDIA NGC経由でAI開発のためのDLフレームワークにアクセス
● TensorコアとNVLinkを使用してAIトレーニング/推論を高速化
Quadro GV100 GPUは、NVIDIAに5120 CUDAコアを組み込むようにカスタマイズされた最新の12nm FFN(FinFET NVIDIA)高性能製造プロセスに基づいて、プロフェッショナルデスクトップ上のHPC、AI、VRおよびグラフィックワークロードのための最も強力なコンピューティングプラットフォームです。
Quadro GV100は従来の世代と比較して学習に8倍のTFLOPSを提供する、ディープラーニングのマトリックス演算専用に設計された新しい混合精度コアのTensorコアを640個使用しています。
業界で最も高速なグラフィックスメモリを実現するVoltaの32GBのHBM2メモリサブシステムを搭載したQuadro GV100は、大規模なデータセットを扱うレイテンシに敏感なアプリケーションにとって理想的なプラットフォームです。Quadro GV100は2倍のメモリ容量および前世代に比べて20%多くのメモリ帯域幅を提供します。
16ビット浮動小数点精度コンピューティングにより、スループットを2倍にし、ストレージ要件を削減し、より大きなニューラルネットワークのトレーニングと展開を可能にします。独立した並列整数と浮動小数点データパスを使用することで、Volta SMは、計算とアドレッシングの計算が混在したワークロードではるかに効率的です。
専用のH.264およびHEVCエンコードエンジンと3D /計算パイプラインとは独立した専用のデコードエンジンを使用して、トランスコード、ビデオ編集、その他のエンコードアプリケーションのリアルタイムパフォーマンスよりも高速なパフォーマンスを提供します。
Quadro GV100カードをNVLinkに接続して、GPUからGPUへのデータ転送を最高100GB/s(双方向)の速度で、200GB/sの帯域幅にすることで、実効メモリフットプリントとアプリケーション性能を向上させます。
複数のGPUを活用して、グラフィックスのパフォーマンスを動的に調整し、画質を向上させ、ディスプレイの実際の価値を拡張し、完全に仮想化されたシステムを組み立てます。
最高の画質と現実的なシーンを実現するため、ビジュアルエイリアシングアーティファクトや「ジャギー」を最大64倍(SLIで128倍)のFSAAで劇的に削減します。
最高の解像度と高品質の画像処理を必要とするアプリケーションをサポートするために、32K x 32Kサーフェスからテクスチャを作成してレンダリングします。
第4世代のロスレスデータ圧縮により、各フレームのメモリからフェッチされるデータ量を削減することにより、帯域幅を最大20%増加させます。
最大4台の5K(@60Hz)モニターまたはデュアル8Kディスプレイをカード毎にサポートします。Quadro GV100は、10/12b HEVCデコードでは4K@60Hz、10b HEVCエンコードでは最大4K@ 60HzのHDRカラーをサポートします。各DisplayPortコネクタは30ビットカラーで4096x2160 @ 120Hzという超高解像度を駆動することができます。
単一の大型ディスプレイまたはマルチディスプレイ環境で生産性を向上させるため、デスクトップ体験に空前のエンドユーザーコントロールを実現します。
静止画像の視覚化と統合デスクトップに最適化された完全なパフォーマンスと画質を提供しながら、デスクトップとアプリケーションを1台のワークステーションから4枚のGPUと16台のディスプレイに透過的に拡大縮小します。
1台のシステム内の8台のGPU(2台のSync IIボードを介して接続)から最大32台のディスプレイへの表示と画像出力を同期させることにより、高度なビデオ視覚化環境を構築するために必要なマシンの数を削減します。
各フレームロックコネクタには、フレームロックケーブルとの接続を確保するための自己ロック式の保持機構が備えられており、堅牢な接続性と最大の生産性を提供します。
プロフェッショナルなアプリケーションにスムーズで没入感のある3Dステレオ体験を提供します。
32K Maxデスクトップサイズの高解像度ディスプレイデバイスを使用して、より多くのモザイクトポロジを選択できます。
3DステレオハードウェアをQuadroグラフィックスカードに直接同期させる専用接続によるステレオエフェクトの強力な制御。
Caffe2、MXNet、CNTK、TensorFlowなどのディープ・ラーニング・フレームワークは、劇的に速いトレーニング時間とより高いマルチノード・トレーニング・パフォーマンスを提供します。cuDNN、cuBLAS、TensorRTなどのGPUアクセラレーションライブラリは、ディープラーニングの推論と高性能コンピューティング(HPC)アプリケーションの両方で高いパフォーマンスを実現します。
C / C ++、Fortranなどの標準プログラミング言語、OpenCL、OpenACC、Direct ComputeなどのAPIをネイティブに実行し、レイトレーシング、ビデオおよび画像処理、流体力学計算などの技術を加速します。
ビデオ用のGPUDirectは、不要なシステムメモリのコピーとCPUオーバーヘッドを避けることにより、GPUとビデオI/Oデバイス間の通信を高速化します。
システムの稼働時間を最大化し、広範囲の配備をシームレスに管理し、効率的な運用のためにグラフィックスと表示設定を遠隔制御します。
Quadro製品は、100社を超える独立系ソフトウェアベンダー(ISV)からアプリケーション認証を取得しています。 包括的な互換性テストと、幅広い業種の主要なサードパーティISVとのパフォーマンスチューニングにより、 最新バージョンのアプリケーションおよび 最新機能のサポートにより最適かつ安定したパフォーマンスが保証 されます。 Download PDF >
GPU アーキテクチャ |
Volta |
CUDA コア |
5120基 |
メモリ容量 |
32GB HBM2 |
メモリインターフェイス |
4096-bit |
メモリ帯域幅 |
最大 870 GB/s |
グラフィックスバス |
PCI Express 3.0 x16 |
倍精度 (FP64) 性能 |
7.4 TFLOPs |
単精度 (FP32) 性能 |
14.8 TFLOPs |
半精度 (FP16) 性能 |
29.6 TFLOPS |
整数演算 (INT8) 性能 |
59.3 TFLOPS |
ディープラーニング性能 |
118.5 TFLOPS |
最大消費電力 |
250 W |
ディスプレイコネクタ |
DP 1.4 ×4 |
DP 1.4/1.3 解像度 |
4096x2160 @ 120Hz ×4 |
冷却ソリューション |
アクティブ |
フォームファクター |
4.4” H x 10.5” L (デュアルスロット、フルハイト) |
グラフィックス API |
Shader Model 5.1、OpenGL 4.51、DirectX 12.02、Vulkan 1.01 |
コンピュート API |
CUDA、DirectCompute、OpenCL™ |
1. 製品は、公開されているKhronos仕様に基づいており、利用可能であれば、Khronos適合テストプロセスに合格する予定です。現在の適合状況は、www.khronos.org/conformanceにあります。 | 2. GPUはDX12.0 API、ハードウェア機能レベル12_1に対応