開創DX11宏圖霸業!鐳HD5870權威評測
第五章/第四節 RV870流處理器規格特性解析
繼續將RV870的SIMD陣列放大,就可以看到其流處理器的微觀架構了。RV870總共擁有320個Thread Processor(線程處理器),這是它不可分割的最小單元,相當于以前的Shader Unit,每個線程處理器內部又包含了5個功能各異的處理核心,因此RV870總共擁有1600個流處理器:
在線程處理器內部,這5個流處理器是在Branch Unit(分歧執行單元)的控制下處理數據流和條件運算,在General Purpose Registers(通用寄存器)中存取或輸出數據,但并不存放指令。與傳統GPU ALU架構不同的是,這5個流處理器可以在動態流控制的支配下自由的處理任何組合形式的指令,諸如1+1+1+1+1、2+2+1、4+1等組合形式。
宏觀上RV870依然是SIMD(單指令多數據流)矢量架構,但在微觀上可以稱之為超標量架構(Superscalar),完美支持Co-issue(矢量指令和標量指令并行執行),單時鐘周期可以進行5次MAD(Multiply-Add,乘加)運算。另外還可以看到,5個1D ALU其中有個“胖”一點的,它除了MAD之外還能夠進行一些特殊(SIN、COS、LOG、EXP等函數)運算,在特殊條件下提高運算效率!
在流處理器部分,RV870加入了DX11新增的位操作類指令,并優化了Sum of Absolute Differences(SAD,誤差絕對值求和)算法,指令執行速度提升12倍,此項指令可以在OpenCL底層執行。SAD算法應用最多的就是H.264/AVC編碼的移動向量估算部分(約占整個AVC編碼總時間的80%),如此一來使用RV870做視頻編碼類通用計算時,性能會大幅提升!
RV870的單精度浮點運算能力為2720GFLOPS,雙精度浮點運算能力為單精度的1/5,也高達544GFLOPS。對手GTX285的單精度浮點運算能力為1063GFLOPS,但雙精度下降為1/8,僅133GFLOPS,很難滿足高精度的科學計算領域的需要。
關注我們



