游戲體驗最重要!NV顯示技術效果實測
基于效能和計算能力方面的考慮,NVIDIA與AMD不約而同的改變了架構,NVIDIA雖然還是采用SIMT架構,但也借鑒了AMD“較老”的SIMD架構之作法,降低控制邏輯單元和指令發射器的比例,用較少的邏輯單元去控制更多的CUDA核心。于是一組SM當中容納了192個核心的壯舉就變成了現實!
通過上面這個示意圖就看的很清楚了,CUDA核心的縮小主要歸功于28nm工藝的使用,而如此之多的CUDA核心,與之搭配的控制邏輯單元面積反而縮小了,NVIDIA強化運算單元削減控制單元的意圖就很明顯了。
開普勒中NVIDIA將一大部分指令派發和控制的操作交給了軟件(驅動)來處理。而且GPU的架構并沒有本質上的改變,只是結構和規模以及控制方式發生了變化,只要驅動支持到位,與游戲開發商保持緊密的合作,效率損失必然會降到最低——事實上NVIDIA著名的The Way策略就是干這一行的!
The Way(游戲之道)計劃可以保證NVIDA的GPU架構與游戲完美兼容
開普勒核心:SMX與SM的改動細節
全新的Kepler相比上代的Fermi架構改變了什么,看架構圖就很清楚了:

Fermi GF100/GF110核心架構圖
GeForce GTX 660(GK106)核心架構
GeForce GTX 660的核心非常奇特,擁有5組SMX單元,“兩個半”GPC。莫非是受到Tegra3五核心的啟發?
NVIDIA把GK104的SM(不可分割的流處理器集群)稱為SMX,原因就是暴增的CUDA核心數量。但實際上其結構與上代的SM沒有本質區別,不同的只是各部分單元的數量和比例而已。具體的區別逐個列出來進行對比:

通過以上數據對比不難看出,GK104暴力增加CUDA核心數量的同時,SFU和TMU這兩個與圖形或計算息息相關處理單元也同比增加,但是指令分配單元和線程調度器還有載入/存儲單元的占比都減半了。這也就是前文中提到過的削減邏輯控制單元的策略,此時如何保證把指令和線程填滿一個CUDA核心,將是一個難題。
關注我們


