再一次改變一切!HD6870/6850全面評測
第二章/第二節 Barts擁有兩個超線程分配處理器
我們知道,NVIDIA從GF100到GF104,雖然CUDA核心方面的改進不大,但對SM(流處理器簇)整體架構進行了重新的排列組合,部分指令分配單元和特殊功能單元被增強。
NVIDIA的MIMD(多指令多數據流)架構將并行指令的調度單元、分配單元都和特殊功能模塊設計在了GPC(圖形處理器集群)或者SM(流處理器簇)內部。而AMD的SIMD(單指令多數據流)架構則是整顆GPU共享單一的控制單元,自R600以來都是如此。
Cypress的單一圖形裝配引擎
但隨著晶體管規模和流處理器數量的迅速膨脹,單一的控制單元已經無法滿足大規模并行指令分配的需要,因此從Cypress開始,AMD采用了“雙核心”的設計,將SIMD陣列一分為二,也就是類似于NVIDIA GPC的設計。與此相對應的,圖形裝配引擎雖然只有一個,內部卻設計了兩個Hierarchical Z(分層消影器)和Rasterizer(光柵器),但是其它的特殊功能模塊均只有一個。
Barts的圖形裝配引擎
Barts和Cypress一樣,依然保持了雙核心設計,圖形裝配引擎也只有一個,內部的功能模塊并沒有太多變化。但是Ultra-Treaded Dispatch Processor(超線程分配處理器)卻變成了兩個,相對應的,超線程分配處理器的指令緩存也變成了兩份。
我們知道,Barts的流處理器數量是Cypress的70%,按理說線程分配壓力有所下降,那么設計兩個線程分配處理器的目的只有一個,那就是提升效率。在DX11時代,幾何著色再加上曲面細分單元引入之后,圖形裝配引擎會產生更多的并行線程及指令轉交SIMD進行處理,因此分配效率成為了新的瓶頸。
SIMD架構的優勢就是可以用較少的晶體管制造成龐大的流處理器規模,擁有恐怖的理論運算能力;但缺點就是流處理器執行效率比MIMD架構低,其效率高低完全依賴于分配單元的派發效率。因此Barts這種雙線程分配處理器的設計意義重大!
關注我們


