NVIDIA GPU為世界上最先進的桌上型機工作站提供動力,為數百萬專業人士的日常工作流程提供了所需的視覺計算能力。專業工作流程的所有階段,從創建,編輯和查看2D和3D模型和視訊,到跨多個顯示器上使用多個應用程式,都受益於獨立型 GPU解決方案才能提供的功能。 NVIDIA入門級專業GPU提供的高級功能和性能遠遠超過整合形GPU解決方案所提供的功能- 均為低結構設計,可在各種小型工作站中進行部署。
作為NVIDIA RTX™專業GPU系列的一部分,NVIDIA T400 | T400 4GB (T400 系列繪圖卡)提供了客戶期望從NVIDIA企業解決方案中獲得的性能,功能,可靠性和支援。隨著企業希望降低其計算解決方案的總成本,同時最大程度地降低對生產力的影響,NVIDIA T400系列繪圖卡為他們提供了一種功能強大且具有成本效益的解決方案,可幫助他們將預算控制在以下範圍內,同時提供比整合型顯卡更好的效能。
NVIDIA T400 系列繪圖卡基於為 NVIDIA 定制的最先進的 12nm FFN(FinFET NVIDIA)高性能製程,包含 384 個 CUDA 核心,是 CAD、DCC、金融服務行業最強大的單插槽專業解決方案(FSI) 和可視化專業人士一般都希望在緊湊而高效的外形中實現卓越的性能。 自 NVIDIA 於 2001 年發明可編程著色器以來,Turing GPU 架構實現了計算機即時圖形渲染的最大飛躍。
Turing 架構繪圖卡具有以下新的高級著色器技術。
網格著色:基於運算的幾何管線,以加速幾何複雜模型和場景的幾何處理和剔除。網格著色對於受限於幾何能力的工作負載提供高達兩倍的效能提升。
可變速率著色 (VRS):根據場景內容,注視方向,和動作來改變著色速率,以提高成像效率。可變速率著色提供相似的影像品質,但著色的像素減少 50%。
材質空間著色:物件/材質空間著色可提高像素著色繁重的工作負載效能,如景深和動態模糊。材質空間著色對於像素著色繁重的 VR 工作負載,重複使用預先著色材質像素,以提高吞吐量,增加 逼真程度。
結合共享記憶體和 L1 快取以大幅提高效能,並簡化程式和減少所需的調整來得到最佳的應用程式效能。每組 SM 包含 96 KB L1/共享記憶體,可根據運算或繪圖工作負載,配置各種容量。對於運算工作,最多可分配 64 KB 到 L1 快取和共享記憶體,而繪圖工作負載最多可分配 48 KB 到共享記憶體;32 KB L1 和 16 KB 材質單元。 結合 L1 快取和共享記憶體可降低延遲並提供更高頻寬。
採用 Turing 高度最佳化的 GDDR6 記憶體子系統,可實現業界最快的繪圖處理速度,具有 2GB或4GB的記憶體容量和 80 GB/s 的峰值頻寬,吞吐量是上一代產品的兩倍。 NVIDIA T400 系列繪圖卡是 3D 專業人士和對大量數據集和多顯示環境要求很高的理想平台。
新的獨立執行緒排程功能可在小型工作間共享資源,實現平行執行緒之間更精細的同步和合作。
16 位元浮點精度運算,可將吞吐量加倍並降低儲存需求,實現更大型神經網絡的訓練和部署。 Turing SM 具備獨立的平行整數和浮點資料路徑,對於運算和位址計算混合的工作負載更有效率。
像素等級搶佔提供更細微的控制,對時間相關的工作支援更佳,例如 VR 動態追蹤。
指令等級搶佔提供對計算工作更精細的控制,以避免長時間執行的應用程式獨佔系統資源或超時。
兩個專屬的 H.264 和 HEVC 編碼引擎以及獨立於 3D/運算管線之外的解碼引擎可提供比即時更快的轉檔,影片編輯,和其他編碼應用程式效能。
自動最大化應用程式效能,而不會超出卡的功耗和散熱範圍。允許應用程式在更高溫下停留在加速時脈狀態更久,才會再降到第二溫度設定的基本時脈。此功能需要軟體應用程式來啟動,而不是獨立的程式。
使用高達 64X FSAA (SLI 模式下 128倍) 大幅降低視覺混疊偽像或「鋸齒」以獲得優秀的影像品質和極為逼真的場景。
材質來自並成像到 32K x 32K 表面以支援需要最高解析度和品質的影像處理應用程式。
將桌面和應用程式從單一工作站擴展到最多 4 個 GPU 和 12 個顯示器,同時提供完整的效能和影像品質。
支援最多三個 5K 螢幕 @ 60Hz,或每卡兩個 8K 顯示器。NVIDIA T400系列繪圖卡支援 HDR 色彩,包括 4K @ 120Hz 10/12b HEVC 解碼以及高達 4K @ 60Hz 10b HEVC 編碼。 每個 DisplayPort 連接頭可驅動 4096x2160 @ 120 Hz 的超高解析度及 30-bit 色彩。
NVIDIA RTX™ 桌面管理器軟體可讓您輕鬆管理單顯示器或多顯示器工作區,為您提供最大的靈活性並控制您的顯示空間和桌面。
為專業應用程式提供流暢與身歷其境的 3D 立體體驗。
將系統正常運作時間最大化,無縫管理大規模部署並遠端控制圖形和顯示設定,以實現高效率運作。
原生執行標準程式語言如 C/C++ 和 Fortran,以及 API 如 OpenCL,OpenACC 和 Direct Compute,以加速光線追蹤,影片和影像處理,以及流體力學計算等技術。
Turing 著色器具有浮點和整數運算的並發執行、自我調適著色技術以及具有兩倍於其前一代記憶體的全新統一記憶體架構,可為現今的專業應用程序帶來驚人的性能提升。
GPU 架構 | NVIDIA Turing |
CUDA 平行處理核心 | 384 |
最高單精度 (FP32) 效能 | 1.094 TFLOPS |
記憶體容量 | 2 GB GDDR6 | 4 GB GDDR6 |
記憶體介面 | 64-bit |
記憶體頻寬 | 最高達 80 GB/s |
最大功耗 | 30 瓦 |
繪圖匯流排 | PCI Express 3.0 x16 |
顯示接頭 | mDP 1.4 (3) |
板型 | 2.713” 高 x 6.137” 長, 單插槽 |
重量 | 123.5g |
散熱方式 | 主動式 |