内射在线播放,97久久精品人人澡人人爽,久久人妻中文字幕

泡泡網(wǎng)顯卡頻道 PCPOP首頁 / 顯卡 / 評測 / 正文

決戰(zhàn)性能之巔！NV雙芯旗艦GTX590評測

2011年03月25日 00:00作者：蔣尚文編輯：蔣尚文文章出處：泡泡網(wǎng)原創(chuàng)

講完了GPC（內(nèi)含光柵引擎）和SM（內(nèi)含多形體引擎）之后，就輪到了GF100的最小單元——流處理器，現(xiàn)在NVIDIA將它稱為CUDA核心。

9.4 GF100圖形架構(gòu)：第三代流處理器的諸多改進(jìn)

論單個CUDA核心，GF100與GT200/G80的基本功能是相同的，沿用了之前的1D標(biāo)量流處理器設(shè)計，無論程序要求什么類型的指令，都可以通過線程分配器打散之后交給CUDA核心處理，從而保證任何指令都能獲得100%的執(zhí)行效率。

GF100的SM與CUDA結(jié)構(gòu)

雖說像素和頂點等4D指令依然是主力，但在進(jìn)入DX10時代后Z緩沖區(qū)（1D）或紋理存取（2D）等非4D指令所占比重越來越多，此時NVIDIA的標(biāo)量流處理器架構(gòu)處理起來依然如魚得水。

● CUDA核心的改進(jìn)：

每一個CUDA核心都擁有一個完全流水線化的整數(shù)算術(shù)邏輯單元（ALU）以及浮點運(yùn)算單元（FPU）。GF100采用了最新的IEEE754-2008浮點標(biāo)準(zhǔn)，2008標(biāo)準(zhǔn)的主要改進(jìn)就是支持多種類型的舍入算法。新標(biāo)準(zhǔn)可以只在最終獲取數(shù)據(jù)時進(jìn)行四舍五入，而以往的標(biāo)準(zhǔn)是每進(jìn)行一步運(yùn)算都要四舍五入一次，最后會產(chǎn)生較大的誤差。

GF100能夠為32bit單精度和64bit雙精度運(yùn)算提供FMA（Fused Multiply-Add，積和熔加）指令，而GT200只在64bit時才能提供。FMA不僅適用于高性能計算領(lǐng)域，事實上在渲染緊密重疊的三角形時，新的FMA算法能夠最大限度的減少渲染誤差。

● 16個載入/存儲單元：

每一個SM都擁有16個載入/存儲單元，從而在每個時鐘周期內(nèi)均可為16個線程運(yùn)算源地址與目標(biāo)地址。支持的單元能夠?qū)⒚總€地址的數(shù)據(jù)載入和存儲到高速緩存或顯存中。

● 四個特殊功能單元：

GF100每個SM內(nèi)部還擁有額外的四個SFU（Special Function Units，特殊功能單元），可用于執(zhí)行抽象的指令，例如正弦、余弦、倒數(shù)和平方根，圖形插值指令也在SFU上執(zhí)行。每個SFU在一個時鐘周期內(nèi)針對每個線程均可執(zhí)行一條指令，一個Warp（32個線程）的執(zhí)行時間可超過八個時鐘周期。SFU流水線從分派單元中分離出來，讓分派單元能夠在SFU處于占用狀態(tài)時分發(fā)給其他執(zhí)行單元。復(fù)雜的程序著色器在特殊功能專用硬件上的運(yùn)行優(yōu)勢尤為明顯。

● 雙Warp調(diào)度器：

SM可對32個為一組的并行線程（又叫做Warp）進(jìn)行調(diào)度。每個SM擁有兩個Warp調(diào)度器以及兩個指令分派單元。這樣就能夠同時發(fā)出和執(zhí)行兩個Warp。

GF100的雙Warp調(diào)度器可選出兩個Warp，從每個Warp發(fā)出一條指令到16個核心、16個載入/存儲單元或4個特殊功能單元。因為Warp是獨(dú)立執(zhí)行的，所以GF100的調(diào)度器無需檢查指令流內(nèi)部的依存關(guān)系。通過利用這種優(yōu)秀的雙指令執(zhí)行（Dual-issue）模式，GF100能夠?qū)崿F(xiàn)接近峰值的硬件性能。

大多數(shù)指令都能夠?qū)崿F(xiàn)雙路執(zhí)行，兩條整數(shù)指令、兩條浮點指令或者整數(shù)、浮點、載入、存儲的混合指令以及SFU指令均可同時執(zhí)行。但雙精度指令不支持與其它指令同時分派。

4人已贊

第1頁：不可思議的存在：GTX590發(fā)布第2頁：第一章：NVIDIA GTX590產(chǎn)品解析第3頁：首發(fā)產(chǎn)品：華碩GTX590 第4頁：首發(fā)產(chǎn)品：索泰GTX590極速版第5頁：首發(fā)產(chǎn)品：映眾GTX590 第6頁：首發(fā)產(chǎn)品：七彩虹iGame590 第7頁：首發(fā)產(chǎn)品：銘瑄GTX590 第8頁：首發(fā)產(chǎn)品：盈通GTX590 第9頁：三大雙芯卡皇實物對比第10頁：第二章：GTX590游戲3D性能測試第11頁：DX10理論測試：《3DMark Vantage》第12頁：DX11理論測試：《3DMark 11》第13頁：Tessellation測試：《Heaven 2.1》第14頁：DX11理論測試：《石巨人》第15頁：DX11游戲測試：《塵埃2》第16頁：DX11游戲測試：《異形大戰(zhàn)鐵血戰(zhàn)士》第17頁：DX11游戲測試：《地鐵2033》第18頁：DX11游戲：《失落星球2》第19頁：DX11游戲：《H.A.W.X.2》第20頁：DX10.1游戲測試：《孤島驚魂2》第21頁：DX10游戲測試：《孤島危機(jī)：彈頭》第22頁：DX10游戲測試：《沖突世界》第23頁：DX9游戲測試：《街頭霸王IV》第24頁：PhysX測試：《黑手黨II》第25頁：CUDA視頻轉(zhuǎn)碼測試第26頁：溫度、功耗、噪音全面領(lǐng)先對手第27頁：性能測試總結(jié)第28頁：第三章：NVIDIA附加圖形技術(shù)之靈活應(yīng)用第29頁：特色技術(shù)應(yīng)用：NV 3D Vison Srround 第30頁：虛擬現(xiàn)實必經(jīng)之路：CUDA光線追蹤第31頁：第四章：最強(qiáng)游戲即時渲染畫面賞析第32頁：DX10基準(zhǔn)：《3DMark Vantage》畫面賞析第33頁：DX11游戲：《HAWX2》畫面賞析第34頁：DX11游戲：《地鐵2033》畫面賞析第35頁：Tessellation軟件：《Heaven》畫面賞析第36頁：Tessellation軟件：《石巨人》畫面賞析第37頁：DX11基準(zhǔn)：《3DMark11》畫面賞析第38頁：第五章：令人興奮的DirectX API發(fā)展歷程第39頁：號稱實現(xiàn)“一切圖形特效”的DX9C 第40頁：不應(yīng)備受冷遇的DX10 第41頁：第六章：揭秘DX11技術(shù)革新第42頁：DX11五大革新之：Shader Model 5.0 第43頁：DX11五大革新之：Multi-Threading 第44頁：DX11五大革新之：Texture Compression 第45頁：第七章爭論漩渦中心的Tessellation 第46頁：Tessellation（曲面細(xì)分）的前世今生第47頁：Tessellation不僅僅會“細(xì)分曲面第48頁：當(dāng)Tessellation遭遇“法線貼圖”第49頁：曲面細(xì)分究極奧義動起來更精彩第50頁：當(dāng)Tessellation遭遇“物理運(yùn)算”第51頁：第八章：DX11核心技術(shù)：DirectCompute11 第52頁：CUDA和Stream之爭的內(nèi)幕第53頁：DirectCompute 10/11版本間的區(qū)別第54頁：DirectCompute11的妙用：順序無關(guān)透明第55頁：DirectCompute11的妙用：電影級景深第56頁：DirectCompute11的妙用：高清晰環(huán)境光第57頁：第九章：GF100/110圖形架構(gòu)深入解析第58頁：GF100構(gòu)架八倍于上代旗艦的幾何性能第59頁：GF100/110和Cayman圖形架構(gòu)對比第60頁：GF100/110圖形架構(gòu)：強(qiáng)大的多形體引擎第61頁：GF100/110圖形架構(gòu)：第三代流處理器第62頁：GF100/110圖形架構(gòu)：精兵簡政的紋理單元第63頁：GF100/110圖形架構(gòu)：一級緩存與二級緩存第64頁：GF100/110圖形架構(gòu)：光柵單元高倍抗鋸齒第65頁：第十章：適合并行計算的Fermi架構(gòu)第66頁：Fermi計算架構(gòu)：GPU的未來是并行計算第67頁：Fermi計算架構(gòu)：高效的雙精度性能第68頁：Fermi計算架構(gòu)：首次支持C++編程第69頁：Fermi計算架構(gòu)：首次支持顯存ECC 第70頁：Fermi計算架構(gòu)：NVIDIA Nexus開發(fā)平臺第71頁：全文總結(jié)：該勝不勝與當(dāng)敗不敗第72頁：附錄：追尋那些曾經(jīng)的雙核卡皇第73頁：Rage Fury Maxx——曙光女神第74頁：曇花一現(xiàn)的挑戰(zhàn)者——XGI Volari V8/V5 第75頁：不為人知的經(jīng)典——雙核心9800Pro 第76頁：普及雙核心——影馳雙核7600GT 第77頁：GeForce 7950GX2——雙拳出擊誓奪王位第78頁：ATI雙核心——Gemini技術(shù)第79頁：雙G92核心的怒吼——GeForce 9800GX2 第80頁：55nm王者——GeForce GTX 295

^{<blockquote id="rrv4c"></blockquote>}

決戰(zhàn)性能之巔！NV雙芯旗艦GTX590評測

關(guān)注我們