CPU/GPU真融合!Intel新酷睿權(quán)威評測
第三章/第七節(jié) SandyBridge架構(gòu):革命性的整合GPU
Intel以往的集顯都給人一種雞肋的感覺,高不成低不就,3D性能非常可憐,2D視頻部分的功能也殘缺不全,與NVIDIA和AMD的整合產(chǎn)品相比,差距非常大。
即便是上代的Clarkdale核心,雖然將CPU和GPU封裝在了一起,但實際物理架構(gòu)和Core 2 + G45時代的模式并沒有不同,只是通過45nm工藝、更多的著色單元和更高頻率提升了些許性能,并沒有革命性的改進(jìn)。
SandyBridge微架構(gòu)最革命性的部分,非整合GPU部分莫屬了。通過前文中的介紹大家應(yīng)該知道,SandyBridge當(dāng)中GPU和CPU計算單元已經(jīng)實現(xiàn)了無縫融合,單一芯片都使用了目前非常先進(jìn)的32nm工藝制造。
SandyBridge GPU有自己的電源島和時鐘域,也支持Turbo Boost技術(shù),可以獨立加速或降頻,并共享三級緩存。顯卡驅(qū)動會控制訪問三級緩存的權(quán)限,甚至可以限制GPU使用多少緩存。將圖形數(shù)據(jù)放在緩存里就不用繞道去遙遠(yuǎn)而“緩慢”的內(nèi)存了,這對提升性能、降低功耗都大有裨益。
可編程著色硬件被稱為EU,包含著色器、核心、執(zhí)行單元等,可以從多個線程雙發(fā)射時取指令。內(nèi)部ISA映射和絕大多數(shù)DX10.1 API指令一一對應(yīng),架構(gòu)很像CISC,結(jié)果就是有效擴(kuò)大了EU的寬度,IPC也顯著提升。抽象數(shù)學(xué)運(yùn)算由EU內(nèi)的硬件負(fù)責(zé),性能得以同步提高。Intel表示,正弦(sine)、余弦(cosine)操作的速度比現(xiàn)在的HD Graphics提升了幾個數(shù)量級。
Intel此前的圖形架構(gòu)中,寄存器文件都是即時重新分配的。如果一個線程需要的寄存器較少,剩余寄存器就會分配給其他線程。這樣雖能節(jié)省核心面積,但也會限制性能,很多時候線程可能會面臨沒有寄存器可用的尷尬。在芯片組集成時代,每個線程平均64個寄存器,Westmere HD Graphics提高到平均80個,Sandybridge則每個線程固定為120個。
所有這些改進(jìn)加起來,SNB里每個EU的指令吞吐量都比現(xiàn)在的GMA HD顯卡增加了一倍。 Intel將新一代的整合顯卡命名為HD Graphics 3000和2000系列,其中3000擁有12個EU、2000擁有6個EU。
得益于每個EU吞吐量翻番、運(yùn)行頻率更高、共享三級緩存等特點,即使只有六個的時候性能也會相當(dāng)令人滿意,都要比上代12個EU的GMA HD顯卡強(qiáng)悍。
關(guān)注我們



