性能與效率的飛躍:HD6970/50完全評測
除了線程處理器架構(gòu)從使用了多年的5D架構(gòu)改成了4D架構(gòu)之外,HD6900為了提升通用計算性能,還采用了異步分配。

AMD以往產(chǎn)品命令隊列流程圖
在AMD過去的產(chǎn)品中,雖然已經(jīng)可以實現(xiàn)同一時間內(nèi)運行多個內(nèi)核,并且將任務(wù)分配到核心當(dāng)中,但執(zhí)行的時候必須由仲裁器和定序器來決定任務(wù)執(zhí)行的先后順序,比如高優(yōu)先級的指令可以直接插隊立即執(zhí)行,而低優(yōu)先級的指令可以被暫時存放在高速緩存之中,等待空閑時機(jī)再進(jìn)行處理。
但在HD6900系列中,AMD對這個架構(gòu)進(jìn)行了改進(jìn),采用了異步分配的方式。也就是說可以將多個命令流在同一時間提交給核心,讓它們立即執(zhí)行。每一個內(nèi)核都擁有獨立的還行緩沖區(qū)和FIFO,所有的命令隊列是獨立的,異步的,具有不同的優(yōu)先級。這允許多個應(yīng)用程序亂序提交工作規(guī)程,并獲得返回結(jié)果。另外,AMD還為每個提交的內(nèi)核配置有獨立的虛擬內(nèi)存,包括完整的頁表,因此,所有這些命令隊列可以進(jìn)入用戶空間,并且都是通過完整的內(nèi)存子系統(tǒng)和高速緩存獲得保護(hù)。
除了異步分配之外,AMD還建造了2個新的DMA,它們可以雙向地讓PCIe帶寬充分飽和??梢源蠓鹊奶岣逩PU的來回吞吐量和系統(tǒng)內(nèi)存讀取速度,和上一代產(chǎn)品相比,帶寬有效地翻倍。核心還采用多種方式進(jìn)行改進(jìn),如直接讀取本地數(shù)據(jù)緩存而完全繞過ALU,改進(jìn)了提取操作的性能。另外整合著色器讀取和優(yōu)化整合產(chǎn)出的寫入將提高著色器的I/O。
最后,HD6900還提升了雙精度運算的執(zhí)行效率,此前的產(chǎn)品中,雙精度性能位單精度性能的1/5,而HD6900的雙精度性能為單精度性能的1/4,已經(jīng)超過了600GFlops??梢钥闯?,AMD在HD6900 系列產(chǎn)品的通用計算性能方面也花了很大的功夫來進(jìn)行改進(jìn)。
渲染器后端升級
HD6900的后端渲染方面主要有三大改進(jìn),分別是“整合寫入操作”、16位整數(shù)(unorm/snorm)操作速度提升2倍、32位浮點(單/雙精度)操作速度提升2-4倍。顯卡抗鋸齒性能將得到進(jìn)一步的提升。
關(guān)注我們


