通用計(jì)算、異構(gòu)計(jì)算、協(xié)同計(jì)算、邊緣計(jì)算等多元產(chǎn)品布局
NVIDIA A10 Tensor Core GPU 與 NVIDIA RTX 虛擬工作站 (vWS) 軟件相結(jié)合,將主流圖形和視頻與 AI 服務(wù)引入主流企業(yè)服務(wù)器,為設(shè)計(jì)師、工程師、藝術(shù)家和科學(xué)家?guī)?lái)應(yīng)對(duì)當(dāng)今挑戰(zhàn)所需的解決方案。A10 基于最新的 NVIDIA Ampere 架構(gòu)而構(gòu)建,將第二代 RT Core、第三代 Tensor Core 和新型流式傳輸微處理器與 24 GB 的 GDDR6 顯存相結(jié)合 (皆在 150W 功率范圍內(nèi)),實(shí)現(xiàn)通用的圖形、渲染、AI 和計(jì)算性能。從可在世界各地訪問(wèn)的虛擬工作站、渲染節(jié)點(diǎn), 到運(yùn)行各種工作負(fù)載的數(shù)據(jù)中心,A10 皆能以單寬、全高、全長(zhǎng) PCIe 外形提供出色性能。 NVIDIA A10 支持作為 NVIDIA-Certified Systems? 的一部分,在本地?cái)?shù)據(jù)中心、云和邊緣中使用。
NVIDIA A10 基于由 NVIDIA NGC? 目錄、CUDA-X? 庫(kù)、超過(guò) 230 萬(wàn)名開發(fā)者和 1800 多個(gè) GPU 優(yōu)化應(yīng)用程序組成的豐富的 AI 框架生態(tài)系統(tǒng)而構(gòu)建,幫助企業(yè)應(yīng)對(duì)其業(yè)務(wù)中的關(guān)鍵挑戰(zhàn)。
速度提升一倍的單精度浮點(diǎn) (FP32) 運(yùn)算處理和改善的能效可顯著提高圖形和計(jì)算工作流程的性能,例如復(fù)雜的 3D 計(jì)算機(jī)輔助設(shè)計(jì) (CAD) 和計(jì)算機(jī)輔助工程 (CAE)。
憑借高達(dá) 2 倍于上一代產(chǎn)品的吞吐量,以及并行運(yùn)行光線追蹤與著色或降噪功能的能力,第二代 RT Core 可大幅加快電影內(nèi)容的逼真渲染、建筑設(shè)計(jì)評(píng)估以及產(chǎn)品設(shè)計(jì)的虛擬原型制作等工作負(fù)載的運(yùn)行速度。這項(xiàng)技術(shù)還可提升光線追蹤動(dòng)態(tài)模糊的渲染速度,從而更快獲得結(jié)果,并增加視覺(jué)準(zhǔn)確度。
Tensor Float 32 (TF32) 精度提供的訓(xùn)練吞吐量高達(dá)上一代的 5 倍,而且無(wú)需更改代碼即可加速 AI 和數(shù)據(jù)科學(xué)模型的訓(xùn)練。從硬件上支持結(jié)構(gòu)化稀疏使推理吞吐量提升一倍。Tensor Core 還為圖形處理引入了諸多 AI 功能,例如為選定應(yīng)用程序帶來(lái)了深度學(xué)習(xí)超級(jí)采樣 (DLSS)、AI 降噪和增強(qiáng)編輯等功能。
超高速 GDDR6 顯存,為渲染、數(shù)據(jù)科學(xué)、工程模擬和其他 GPU 顯存密集型工作負(fù)載提供 600 GB/s 帶寬。
PCI Express 4.0 提供的帶寬比 PCIe Gen 3 多一倍,提高了 CPU內(nèi)存的數(shù)據(jù)傳輸速度,從而可以更快地處理 AI、數(shù)據(jù)科學(xué)和 3D 設(shè)計(jì)等數(shù)據(jù)密集型任務(wù)。更快的 PCIe 性能還能加速 GPU 直接顯存訪問(wèn) (DMA) 傳輸,這在 GPU 與支持 NVIDIA GPUDirect® for Video 的設(shè)備之間提供了更快的視頻數(shù)據(jù)輸入/輸出通信速度,從而帶來(lái)強(qiáng)大的直播解決方案。 A10 還向后兼容 PCI Express 3.0,這提供了部署靈活性。
NVIDIA A10 采用單插槽、全高、全長(zhǎng)節(jié)能設(shè)計(jì),可兼容全球 OEM 供應(yīng)商生產(chǎn)的各式服務(wù)器。 NVIDIA A10 包含通過(guò)硬件信任根技術(shù)進(jìn)行安全可靠的引導(dǎo),確保固件不會(huì)被篡改或損壞。
A10 技術(shù)規(guī)格和功能 | |
---|---|
FP32 | 31.2 兆次浮點(diǎn)運(yùn)算 |
TF32 Tensor 核心 | 62.5 兆次浮點(diǎn)運(yùn)算 | 125 兆次浮點(diǎn)運(yùn)算* |
BFLOAT16 Tensor 核心 | 125 兆次浮點(diǎn)運(yùn)算 | 250 兆次浮點(diǎn)運(yùn)算* |
FP16 Tensor 核心 | 125 兆次浮點(diǎn)運(yùn)算 | 250 兆次浮點(diǎn)運(yùn)算* |
INT8 Tensor 核心 | 250 兆次浮點(diǎn)運(yùn)算 | 500 兆次浮點(diǎn)運(yùn)算* |
INT4 Tensor 核心 | 500 兆次浮點(diǎn)運(yùn)算 | 1,000 兆次浮點(diǎn)運(yùn)算* |
RT 核心 | 72 個(gè) RT 核心 |
編碼/譯碼 | 1 個(gè)編碼器 2 個(gè)譯碼器 (+AV1 解碼) |
GPU 內(nèi)存 | 24GB GDDR6 |
GPU 內(nèi)存帶寬 | 每秒 600 GB |
互連技術(shù) | 第四代 PCIe 64GB/秒 |
尺寸規(guī)格 | 單插槽、全高全長(zhǎng)尺寸 (FHFL) |
最大散熱設(shè)計(jì)功耗 (TDP) | 150W |
虛擬化 GPU 軟件支持 | NVIDIA 虛擬 PC、NVIDIA 虛擬應(yīng)用程序、NVIDIA RTX 虛擬化工作站、NVIDIA 虛擬化運(yùn)算服務(wù)器 |