在規(guī)格參數(shù)方面,A100核心采用的是臺積電7N工藝,也就是定制版的7nm工藝,核心面積為826mm²,擁有542億個晶體管,108組SM單元、SXM4架構(gòu),6912個CUDA核心。Tensor Core數(shù)量雖然相比Volta的640個減少到了432個,但性能卻有大幅增強,支持全新的TF32運算,浮點性能為156TFLOPS,同時INT8浮點性能為624TOPS,F(xiàn)P16性能為312TFLOPS,常規(guī)FP32和FP64性能提升到了19.5、9.7TFLOPS。
A100核心在頻率方面有所降低,僅為1410MHz,相比上一代V100的1530MHz降低了不少,畢竟核心規(guī)模實在太大了,功耗已經(jīng)飆到了400W,比V100的300/350W功耗高出不少。
顯存方面A100配備的也是HBM2顯存,頻率為2.4Gbps,位寬5120bit,相比V100有了全面提升,容量也增加到了40GB。而HBM2顯存位寬和頻率雙雙提升的結(jié)果就是,A100核心的顯存帶寬達到了1.6TB/s,遠高于V100的900GB/s和AMD Radeon VII的1TB/s。
NVLink3.0帶寬為600GB/s,相比2.0的300GB/s直接提升了一倍,以滿足服務器領域多卡互聯(lián)的需求。


雖然黃仁勛在演講中并沒有提及到PCIe4.0,但在官方資料中,我們卻可以在安培的架構(gòu)圖上看到“PCIe4.0主控界面”的字樣,同時在A100計算卡的規(guī)格表中也列有“PCIe4.0 64GB/s”。至于未來的RTX 30系列游戲卡是否也支持PCIe4.0,目前還沒有確切消息,但從最近NVIDIA和AMD的“親密”互動中,不難猜想RTX 30系列游戲顯卡也將會全面支持PCIe4.0。至于事實如何,不妨讓我們等到今年9月份新一代游戲顯卡發(fā)布后再見分曉。