尼克?斯塔姆強調(diào),其實不只是構(gòu)架與制程的更新,NVIDIA在Pascal上還投注了高度的工藝技術(shù)心血,讓該構(gòu)架達(dá)到前所未有的效益。他透露,原本Pascal構(gòu)架芯片在開發(fā)初期的增幅時脈只能達(dá)到1325MHz,但是在整體電路布局最佳化的努力之下,最后達(dá)到1733MHz,提升了30%之多。因此工藝技術(shù)的投入,是不亞于新構(gòu)架與新制程的關(guān)鍵之一。
GTX 1080采用代號GP104的圖型處理器核心,由72億晶體管構(gòu)成,搭載2560個單精度浮點數(shù)CUDA核心,提供約9TFLOPS的單精度浮點數(shù)運算性能。由于是針對3D圖形處理應(yīng)用,因此倍精度浮點數(shù)運算性能只有單精度的1/32,比例比高效能運算用途的Tesla P100采用的GP100核心低很多(1/3),不過GP100的晶體管高達(dá)153億個,兩者的規(guī)模相差很大。
在Preemption(搶占式多工)的部分,Pascal首度支持像素(Pixel)單位的多工切換,GPU可以在繪制多邊形內(nèi)部單一像素時暫停此一工作切換到其他工作,之后再切回來繼續(xù)處理。DX12數(shù)值計算則能以線程單位切換,CUDA運算則是能以更細(xì)微的指令為單位切換。切換的延遲低于100微秒(100µs,即萬分之一秒)。藉由高速多工切換的特性,Pascal在VR應(yīng)用下能更快速在圖形處理與非同步時間調(diào)整(Asynchronous Timewarp)兩個工作之間切換,減少性能閑置。