超碰人人妻,久久久久久AV无码免费网站动漫,中文字幕av久久爽一区

泡泡網(wǎng)顯卡頻道 PCPOP首頁 / 顯卡 / 評測 / 正文

完美DX10!ATI新王者HD2900XT權(quán)威評測

2007年05月15日 08:10作者：泡泡網(wǎng)評測室編輯：孫敏杰

第四章\\第六節(jié)\\第三小節(jié) R600的超標(biāo)量SIMD架構(gòu)

從架構(gòu)圖上來看，R600擁有64個(gè)Stream Processing Units，它依然是傳統(tǒng)的SIMD架構(gòu)，但不能簡單地認(rèn)為它擁有64個(gè)流處理器，因?yàn)镽600的每個(gè)Units內(nèi)部包含了5個(gè)超標(biāo)量ALU：

R600每個(gè)Stream Processing Units的結(jié)構(gòu)

Branch Execution Unit（分歧執(zhí)行單元）進(jìn)行流控制和條件運(yùn)算，BEU獲得指令包后將會(huì)安排至它管轄下5個(gè)ALU執(zhí)行，流控制效率非常高，幾乎不產(chǎn)生延遲或者性能損失。General Purpose Registers（通用寄存器）存儲(chǔ)輸入數(shù)據(jù)、臨時(shí)數(shù)值和輸出數(shù)據(jù)，并不存放指令。

與傳統(tǒng)GPU ALU架構(gòu)不同的是，R600的5D SIMD矢量ALU可以在動(dòng)態(tài)流控制的支配下自由的處理任何組合形式的指令，諸如1+1+1+1+1、2+2+1、4+1等組合形式。

換句話說，既然是5D SIMD矢量架構(gòu)，那么內(nèi)部的5個(gè)1D ALU就只共享一個(gè)指令發(fā)射端口，但是R600的Thread Processor可以智能的將各種離散指令（比如將5個(gè)1D指令）分類打包，然后通過分支執(zhí)行單元交給5D SIMD矢量ALU處理，這樣同樣能夠保證GPU所有的ALU資源不被浪費(fèi)！

宏觀上R600依然是SIMD矢量架構(gòu)，但在微觀上可以稱之為超標(biāo)量架構(gòu)，完美支持Co-issue（矢量指令和標(biāo)量指令并行執(zhí)行），單時(shí)鐘周期可以進(jìn)行5次MAD（Multiply-Add，乘加）運(yùn)算。另外還可以看到，5個(gè)1D ALU其中有個(gè)“胖”一點(diǎn)的，它除了MAD之外還能夠進(jìn)行一些特殊（SIN、COS、LOG、EXP等函數(shù)）運(yùn)算，在特殊條件下提高運(yùn)算效率！

現(xiàn)在R600的架構(gòu)優(yōu)勢就完全體現(xiàn)了出來，它擁有如假包換的64×5＝320個(gè)恐怖ALU陣容，說它是320個(gè)流處理器毫不為過，尤其是在科學(xué)計(jì)算方面，320個(gè)流處理器可以很容易就發(fā)揮出接近100%的效能，而普通多核心CPU想要發(fā)揮出70%的效能都非常困難。

通過上圖可以看出R600XT的理論浮點(diǎn)算術(shù)運(yùn)算能力＝320（SPU）×2（MAD指令）× 742MHz＝475 GLOPS，而G80Ultra的理論浮點(diǎn)算術(shù)運(yùn)算能力＝128×2×1500MHz＝384 GLOPS。R600的晶體管規(guī)模與G80相近，卻實(shí)現(xiàn)了更高的理論運(yùn)算能力，并且突破了傳統(tǒng)GPU架構(gòu)的瓶頸，提升了單位晶體管所實(shí)現(xiàn)的效能！但是，理論歸理論，GPU在實(shí)際游戲中的表現(xiàn)還要受到多方面因素的制約，R600的動(dòng)態(tài)流控制能否最大限度發(fā)揮320個(gè)流處理器的實(shí)力，這還有待測試證明。

通過前面的分析我們可以初步得出這樣的結(jié)論：G80純標(biāo)量架構(gòu)的效能比較依賴于將矢量指令拆分為標(biāo)量指令的效率；而R600超標(biāo)量架構(gòu)的效能依賴于將各種混合指令重新排序并且打包分配給SIMD單元的效率。R600雖然在流處理器數(shù)量上有著絕對優(yōu)勢，但在架構(gòu)執(zhí)行效率方面受到的限制也比較多。

0人已贊

第1頁：完美DX10!ATI新王者HD2900XT權(quán)威評測第2頁：完美DX10！ATI HD2000系列評測提綱第3頁：2007顯卡年!AMD/NVIDIA決戰(zhàn)圖形市場第4頁：奮起直追!全新Radeon HD 2000產(chǎn)品線解析第5頁：功能化發(fā)展！Radeon HD2000系列亮點(diǎn)逐個(gè)看第6頁：第二章：統(tǒng)一渲染架構(gòu)解析第7頁：第二章/第二節(jié)：革命！R600的統(tǒng)一渲染架構(gòu)第8頁：4 第9頁：第三章：DirectX發(fā)展回顧以及DirectX10詳細(xì)介紹第10頁：第二節(jié) DX10的架構(gòu)特性以及帶來的好處第11頁：第三章/第三節(jié):ATI 3Dc功能回顧第12頁：3 第13頁：3 第14頁：3 第15頁：3 第16頁：集眾家之長，R600架構(gòu)總覽第17頁：R600架構(gòu)分塊介紹第18頁：Setup Engine（裝配引擎）第19頁：Ultra-Threaded Dispatch Processor（超線程分配處理器）第20頁：Stream Processing Units（流處理器）第21頁：R600的超標(biāo)量SIMD架構(gòu)第22頁：4 第23頁：5 第24頁：ATI片內(nèi)緩存相關(guān)技術(shù)第25頁：Memory Control（顯存控制器）第26頁：第六章 R600的神工鬼斧——Tessellation技術(shù)第27頁：第六章\\第二節(jié) 傳統(tǒng)的虛擬3D技術(shù)回顧第28頁：第二小節(jié) 凹凸貼圖 Bump mapping 第29頁：第六章\\第二節(jié)\\第三小節(jié) 法線貼圖（normal mapping）第30頁：視差貼圖技術(shù)parallax occlusion mapping 第31頁：位移貼圖（displacement mapping）第32頁：Ati的獨(dú)門秘籍 Trumform 第33頁：Tessellation技術(shù)第34頁：神奇的小數(shù)點(diǎn)——細(xì)分網(wǎng)格算法中小數(shù)位的意義第35頁：Tessellation效率的源泉——控制“籠子”第36頁：Tessellation技術(shù)的流程第37頁：Tessellation技術(shù)的應(yīng)用和前景第38頁：1 第39頁：AA發(fā)展第40頁：CFAA 第41頁：123 第42頁：ATI顯卡產(chǎn)品形象代言人——Ruby四度出擊第43頁：X800 & X850 Ruby 第44頁：DX9C的最高境界 X1800 Ruby 第45頁：R600 DX10 Ruby高清晰截圖賞析第46頁：R600 DX10 Ruby引擎和技術(shù)解析第47頁：23 第48頁：R600 DX10 Ruby所用圖形引擎揭秘第49頁：1 第50頁：2 第51頁：第九章\\第二節(jié)第52頁：龐大的運(yùn)算資源，R600單卡就能物理加速第53頁：3 第54頁：第四章：AMD高清視頻功能解析第55頁：22 第56頁：第三節(jié) 硬件視頻加速第57頁：第四節(jié) UVD 引擎解碼流程第58頁：第五節(jié) UVD測試第59頁：第一節(jié) 電腦音頻的數(shù)碼之路第60頁：第二節(jié) HDMI數(shù)字音頻技術(shù)背景第61頁：第三節(jié) 各種顯卡HDMI接口方案第62頁：第四節(jié) R600系列方案第63頁：第五節(jié)：實(shí)戰(zhàn)R600音頻播放第64頁：第六節(jié) HD 2900XT怎么用？第65頁：顯卡介紹第66頁：123123 第67頁：顯卡介紹第68頁：123 第69頁：顯卡介紹第70頁：3 第71頁：123123 第72頁：測試系統(tǒng)配置和設(shè)置第73頁：阿蘇大發(fā)送顛覆第74頁：113123 第75頁：4 第76頁：05 第77頁：06 第78頁：游戲第79頁：游戲第80頁：123 第81頁：6 第82頁：6 第83頁：交火第84頁：功耗測試第85頁：1 第86頁：第二節(jié) 客觀，公正，專業(yè)，全面，泡泡網(wǎng)為您帶來最權(quán)威的DX10測試第87頁：第三節(jié) Call of Juarez游戲DX10測試第88頁：第四節(jié) DirectX SDK測試（微軟官方2007年四月版）第89頁：第四小節(jié)：Draw Predicated 第90頁：第七小節(jié)：MotionBlur10 第91頁：第十小節(jié)：Skining 10 第92頁：第十四章總結(jié) 另覓藍(lán)海！AMD讓ATI看得更遠(yuǎn)第93頁：123

完美DX10!ATI新王者HD2900XT權(quán)威評測

關(guān)注我們