Maxwell領銜!A/N新顯卡能效深度測試
在這里我們不難看出,Maxwell內部所有單元和橫梁結構均得到了重新設計,數據流得到了優化,功率管理實現了大幅改變。
雖然從圖形特性的視角來看,第一代Maxwell GPU可提供與Kepler GPU相同的API功能,但從深層來上,Maxwell還在單個GPC(圖形處理簇)內實現了多個SM單元,每個SM包含一個多形體引擎(Polymorph Engine)和紋理單元,而每個GPC包含一個光柵引擎(Raster Engine)。ROP依然與二級高速緩存片(L2 Cache Slice)以及顯存控制器聯系在一起。
GM107全芯片框圖
GM 107 GPU包含一個GPC、五個Maxwell流式多處理器(SMM)以及兩個64位顯存控制器(共128位)。這就是這一芯片的完整實現形式,與GeForce GTX 750Ti中的芯片配置相同。
GK107全芯片框圖
SMX 處理核架構
上一代Kepler的方法是劃分為非2冪(non-power-of-two)數量的CUDA核心,其中一些是共享核心,這種方法需要的SM調度器數量較少,但復雜程度較高,在各種各樣的游戲引擎環境中表現并不理想。
SMX: 192個單精度CUDA核、64個雙精度單元、32個特殊功能單元(SFU)和32 個加載/存儲單元(LD/ST)。
每個SMX單元具有192單精度CUDA核,每個核完全由浮點和整數算術邏輯單元組成。Kepler完全保留Fermi引入的IEEE 754-2008 標準的單精度和雙精度算術,包括積和熔加(FMA)運算。
成對的處理塊共享四個紋理過濾單元和一個紋理高速緩存。計算一級高速緩存的功能現在也與紋理高速緩存功能相結合,而共享顯存是一個獨立的單元(類似首款CUDAGPU——G80中所使用的方法),被全部四個塊共享。
SMM 處理核架構
Maxwell SM框圖
而現在每個SM分為四個獨立的處理塊,每個處理塊具備自己的指令緩沖區、調度器以及32個CUDA核心。新的劃分方法簡化了設計與調度邏輯、節省了晶體管與功耗、降低了計算延遲。
總體而言,在這一全新設計上,每個“SM”的尺寸得到大幅縮減,而性能卻能夠達到一個KeplerSM的90%。更小的晶體管消耗讓NVIDIA能夠在每顆GPU中實現更多數量的SM。通過對比GK107和GM107 SM總數的相關指標可發現,GM107有五個SM,而前者只有兩個。GM107的峰值紋理性能比前者高25%,CUDA核心數量多1.7倍,著色器性能大約高2.3倍。
● SMM架構顯存系統的改進
對GM107來說,要在顯存位寬與GK107相同的情況下實現性能大幅提升的目標,增強顯存系統也同樣重要。內部顯存系統帶寬實現了提升,另外這一設計的效率也得到了改善。此外,2MB大容量二級高速緩存配置(比之前的任何GPU設計都大)十分有效地降低了顯存帶寬需求,確保了DRAM帶寬不成為瓶頸。
其他關于Maxwell架構的基本信息,例如通過Giga Thread引擎的主PCI Express接口數據流、Polymorph與Raster單元的基本操作等等過于晦澀的知識這里就不再贅述了。
關注我們



