DX11性價比之王!GTX460雙雄權威評測
分享
第二章/第二節 GF104流處理器效率的改進
● 每組SM中特殊功能單元數量從4個增至8個:
GF100每個SM內部還擁有額外的四個SFU(Special Function Units,特殊功能單元),可用于執行抽象的指令,例如正弦、余弦、倒數和平方根,圖形插值指令也在SFU上執行。
GF104每個SM內部CUDA核心數量增加50%之后,NVIDIA并沒有讓SFU數量也增加50%,而是像紋理單元那樣,直接翻倍,從4個增至8個。
SFU和Dispatch Unit數量加倍
每個SFU在一個時鐘周期內針對每個線程均可執行一條指令,一個Warp(32個線程)的執行時間可超過八個時鐘周期。SFU流水線從分派單元中分離出來,讓分派單元能夠在SFU處于占用狀態時分發給其他執行單元。復雜的程序著色器在特殊功能專用硬件上的運行優勢尤為明顯。
● 每組SM中指令分配單元從2個增至4個:
CUDA核心數量增加50%之后,并行線程調度器的負擔顯然將會更重,如果指令不能分配到每一個CUDA核心,那將會造成資源閑置,使得運算能力不如預期。NVIDIA意識到了這一點,于是直接將指令分配單元的數量加倍,由2個變為4個。
圖為GF100核心的Warp調度器和指令分配模式
現在,GF104的SM可對48個為一組的并行線程(又叫做Warp)進行調度。每個SM擁有兩個Warp調度器以及四個指令分派單元,這樣每個Warp周期可以并發執行兩條指令,每個SM一次可以執行四條指令。
0人已贊
第1頁:Fermi家族再添新丁!NV發布全新重磅產品第2頁:圖形架構設計思路:小修小補與重新設計第3頁:高端產品設計思路:小核心與大核心之戰第4頁:中端產品設計思路:一刀兩半與優化設計第5頁:改進流處理器架構:CUDA增50%紋理增100%第6頁:優化流處理器效率:特殊功能和指令分配第7頁:刪除無用功能單元:顯存ECC和雙精度第8頁:經典G92核心再世!GTX460保留實力第9頁:特色功能之戰:GTX460支持音頻源碼輸出第10頁:特色功能之戰:3D Vision雄霸天下第11頁:特色功能之戰:雙卡三屏對抗Eyefinity第12頁:特色功能之戰:AMD無法染指的物理加速第13頁:特色功能之戰:CUDA遙遙領先于Stream第14頁:NVIDIA公版GTX460 1GB顯卡實物拆解第15頁:NVIDIA公版GTX460 768MB顯卡實物拆解第16頁:首批GTX460顯卡:索泰1GB和768MB第17頁:首批GTX460顯卡:七彩虹非公版1GB第18頁:首批GTX460顯卡:影馳非公版1GB第19頁:首批GTX460顯卡:翔升非公版1GB第20頁:首批GTX460顯卡:映眾微星旌宇768MB公版第21頁:測試平臺:Core i7 875 + P55第22頁:DX9C理論:《3DMark06》第23頁:DX9C游戲:《使命召喚6:現代戰爭2》第24頁:DX9C游戲:《星際爭霸2:自由之翼》第25頁:DX9C游戲:《極品飛車13:變速》第26頁:DX9C游戲:《蝙蝠俠:阿卡姆瘋人院》第27頁:DX10理論:《3DMark Vantage》第28頁:DX10游戲:《孤島危機:彈頭》第29頁:DX10游戲:《沖突世界:蘇聯進攻》第30頁:DX10.1游戲:《孤島驚魂2》第31頁:DX10.1游戲:《鷹擊長空》第32頁:DX11理論:《Heaven Benchmark 2.0》第33頁:DX11游戲:《BattleForge》第34頁:DX11游戲:《塵埃2》第35頁:DX11游戲:《潛行者》第36頁:DX11游戲:《異型大戰鐵血戰士》第37頁:DX11游戲:《戰地:叛逆聯隊2》第38頁:DX11游戲:《地鐵2033》第39頁:DX11演示:《石巨人》第40頁:附加測試:GTX460待機功耗低于HD5770第41頁:附加測試:GTX460最高僅66度第42頁:附加測試:CUDA性能之蛋白質折疊第43頁:附加測試:CUDA性能之視頻轉碼第44頁:附加測試:GTX460高頻版大戰HD5850第45頁:成績匯總:GTX460 1GB比768MB強多少第46頁:成績匯總:GTX460比GTX465強多少第47頁:成績匯總:GTX460 1GB PK HD5830第48頁:成績匯總:GTX460 768MB PK HD5830第49頁:全文總結:千元顯卡市場重新洗牌
關注我們



