完美DX10!ATI新王者HD2900XT權(quán)威評測
分享
第四章\\第六節(jié)\\第三小節(jié) R600的超標(biāo)量SIMD架構(gòu)
從架構(gòu)圖上來看,R600擁有64個(gè)Stream Processing Units,它依然是傳統(tǒng)的SIMD架構(gòu),但不能簡單地認(rèn)為它擁有64個(gè)流處理器,因?yàn)镽600的每個(gè)Units內(nèi)部包含了5個(gè)超標(biāo)量ALU:
R600每個(gè)Stream Processing Units的結(jié)構(gòu) Branch Execution Unit(分歧執(zhí)行單元)進(jìn)行流控制和條件運(yùn)算,BEU獲得指令包后將會(huì)安排至它管轄下5個(gè)ALU執(zhí)行,流控制效率非常高,幾乎不產(chǎn)生延遲或者性能損失。General Purpose Registers(通用寄存器)存儲(chǔ)輸入數(shù)據(jù)、臨時(shí)數(shù)值和輸出數(shù)據(jù),并不存放指令。
與傳統(tǒng)GPU ALU架構(gòu)不同的是,R600的5D SIMD矢量ALU可以在動(dòng)態(tài)流控制的支配下自由的處理任何組合形式的指令,諸如1+1+1+1+1、2+2+1、4+1等組合形式。
換句話說,既然是5D SIMD矢量架構(gòu),那么內(nèi)部的5個(gè)1D ALU就只共享一個(gè)指令發(fā)射端口,但是R600的Thread Processor可以智能的將各種離散指令(比如將5個(gè)1D指令)分類打包,然后通過分支執(zhí)行單元交給5D SIMD矢量ALU處理,這樣同樣能夠保證GPU所有的ALU資源不被浪費(fèi)!
宏觀上R600依然是SIMD矢量架構(gòu),但在微觀上可以稱之為超標(biāo)量架構(gòu),完美支持Co-issue(矢量指令和標(biāo)量指令并行執(zhí)行),單時(shí)鐘周期可以進(jìn)行5次MAD(Multiply-Add,乘加)運(yùn)算。另外還可以看到,5個(gè)1D ALU其中有個(gè)“胖”一點(diǎn)的,它除了MAD之外還能夠進(jìn)行一些特殊(SIN、COS、LOG、EXP等函數(shù))運(yùn)算,在特殊條件下提高運(yùn)算效率!
現(xiàn)在R600的架構(gòu)優(yōu)勢就完全體現(xiàn)了出來,它擁有如假包換的64×5=320個(gè)恐怖ALU陣容,說它是320個(gè)流處理器毫不為過,尤其是在科學(xué)計(jì)算方面,320個(gè)流處理器可以很容易就發(fā)揮出接近100%的效能,而普通多核心CPU想要發(fā)揮出70%的效能都非常困難。
通過上圖可以看出R600XT的理論浮點(diǎn)算術(shù)運(yùn)算能力=320(SPU)×2(MAD指令)× 742MHz=475 GLOPS,而G80Ultra的理論浮點(diǎn)算術(shù)運(yùn)算能力=128×2×1500MHz=384 GLOPS。R600的晶體管規(guī)模與G80相近,卻實(shí)現(xiàn)了更高的理論運(yùn)算能力,并且突破了傳統(tǒng)GPU架構(gòu)的瓶頸,提升了單位晶體管所實(shí)現(xiàn)的效能!但是,理論歸理論,GPU在實(shí)際游戲中的表現(xiàn)還要受到多方面因素的制約,R600的動(dòng)態(tài)流控制能否最大限度發(fā)揮320個(gè)流處理器的實(shí)力,這還有待測試證明。
0人已贊
第1頁:完美DX10!ATI新王者HD2900XT權(quán)威評測第2頁:完美DX10!ATI HD2000系列評測提綱第3頁:2007顯卡年!AMD/NVIDIA決戰(zhàn)圖形市場第4頁:奮起直追!全新Radeon HD 2000產(chǎn)品線解析第5頁:功能化發(fā)展!Radeon HD2000系列亮點(diǎn)逐個(gè)看第6頁:第二章:統(tǒng)一渲染架構(gòu)解析第7頁:第二章/第二節(jié):革命!R600的統(tǒng)一渲染架構(gòu)第8頁:4第9頁:第三章:DirectX發(fā)展回顧以及DirectX10詳細(xì)介紹第10頁:第二節(jié) DX10的架構(gòu)特性 以及帶來的好處第11頁:第三章/第三節(jié):ATI 3Dc功能回顧第12頁:3第13頁:3第14頁:3第15頁:3第16頁:集眾家之長,R600架構(gòu)總覽第17頁:R600架構(gòu)分塊介紹第18頁:Setup Engine(裝配引擎)第19頁:Ultra-Threaded Dispatch Processor(超線程分配處理器)第20頁:Stream Processing Units(流處理器)第21頁:R600的超標(biāo)量SIMD架構(gòu)第22頁:4第23頁:5第24頁:ATI片內(nèi)緩存相關(guān)技術(shù)第25頁:Memory Control(顯存控制器)第26頁:第六章 R600的神工鬼斧——Tessellation技術(shù)第27頁:第六章\\第二節(jié) 傳統(tǒng)的虛擬3D技術(shù)回顧第28頁:第二小節(jié) 凹凸貼圖 Bump mapping第29頁:第六章\\第二節(jié)\\第三小節(jié) 法線貼圖(normal mapping)第30頁:視差貼圖技術(shù)parallax occlusion mapping第31頁:位移貼圖(displacement mapping)第32頁:Ati的獨(dú)門秘籍 Trumform 第33頁:Tessellation技術(shù)第34頁:神奇的小數(shù)點(diǎn)——細(xì)分網(wǎng)格算法中小數(shù)位的意義第35頁:Tessellation效率的源泉——控制“籠子”第36頁:Tessellation技術(shù)的流程第37頁:Tessellation技術(shù)的應(yīng)用和前景第38頁:1第39頁:AA發(fā)展第40頁:CFAA第41頁:123第42頁:ATI顯卡產(chǎn)品形象代言人——Ruby四度出擊第43頁:X800 & X850 Ruby第44頁:DX9C的最高境界 X1800 Ruby第45頁:R600 DX10 Ruby高清晰截圖賞析第46頁:R600 DX10 Ruby引擎和技術(shù)解析第47頁:23第48頁:R600 DX10 Ruby所用圖形引擎揭秘第49頁:1第50頁:2第51頁:第九章\\第二節(jié)第52頁:龐大的運(yùn)算資源,R600單卡就能物理加速第53頁:3第54頁:第四章:AMD高清視頻功能解析第55頁:22第56頁:第三節(jié) 硬件視頻加速第57頁:第四節(jié) UVD 引擎解碼流程第58頁:第五節(jié) UVD測試第59頁:第一節(jié) 電腦音頻的數(shù)碼之路第60頁:第二節(jié) HDMI數(shù)字音頻技術(shù)背景第61頁:第三節(jié) 各種顯卡HDMI接口方案第62頁:第四節(jié) R600系列方案第63頁:第五節(jié):實(shí)戰(zhàn)R600音頻播放第64頁:第六節(jié) HD 2900XT怎么用?第65頁:顯卡介紹第66頁:123123第67頁:顯卡介紹第68頁:123第69頁:顯卡介紹第70頁:3第71頁:123123第72頁:測試系統(tǒng)配置和設(shè)置第73頁:阿蘇大發(fā)送顛覆第74頁:113123第75頁:4第76頁:05第77頁:06第78頁:游戲第79頁:游戲第80頁:123第81頁:6第82頁:6第83頁:交火第84頁:功耗測試第85頁:1第86頁:第二節(jié) 客觀,公正,專業(yè),全面,泡泡網(wǎng)為您帶來最權(quán)威的DX10測試第87頁:第三節(jié) Call of Juarez游戲DX10測試 第88頁:第四節(jié) DirectX SDK測試(微軟官方2007年四月版)第89頁:第四小節(jié):Draw Predicated第90頁:第七小節(jié):MotionBlur10第91頁:第十小節(jié):Skining 10第92頁:第十四章 總結(jié) 另覓藍(lán)海!AMD讓ATI看得更遠(yuǎn)第93頁:123


