日本无码一区二区,国产老熟女伦老熟妇露脸,97久久精品人人澡人人爽

泡泡網顯卡頻道 PCPOP首頁 / 顯卡 / 評測 / 正文

決戰性能之巔！NV雙芯旗艦GTX590評測

2011年03月25日 00:00作者：蔣尚文編輯：蔣尚文文章出處：泡泡網原創

GF100核心擁有很多種類的緩存，他們的用途不盡相同，其中一級緩存、共享緩存和紋理緩存位于SM內部，二級緩存則是獨立的一塊，與光柵單元及顯存控制器相連。

9.6 一級緩存與二級緩存

● 64KB可配置共享緩存與一級高速緩存

以往的GPU都是沒有一級緩存的，只有一級紋理緩存，因為這些緩存無法在通用計算中用于存儲計算數據，只能用于在紋理采樣時暫存紋理。而在GF100當中，NVIDIA首次引入真正的一級高速緩存，而且還可被動態的劃分為共享緩存。

在GF100 GPU中，每個SM除了擁有專用的紋理緩存外，還擁有64KB容量的片上緩存，這部分緩存可配置為16KB的一級緩存+48KB共享緩存，或者是48KB一級緩存+16KB共享緩存。這種劃分方式完全是動態執行的，一個時鐘周期之后可自動根據任務需要即時切換而不需要程序主動干預。

一級緩存與共享緩存是互補的，共享緩存能夠為明確界定存取數據的算法提升存取速度，而一級緩存則能夠為一些不規則的算法提升存儲器存取速度。在這些不規則算法中，事先并不知道數據地址。

對于圖形渲染來說，重復或者固定的數據比較多，因此一般是劃分48KB為共享緩存，當然剩下的16KB一級緩存也不是完全沒用，它可以充當寄存器溢出的緩沖區，讓寄存器能夠實現不俗的性能提升。

而在并行計算之中，一級緩存與共享緩存同樣重要，它們可以讓同一個線程塊中的線程能夠互相協作，從而促進了片上數據廣泛的重復利用并減少了片外的通信量。共享存儲器是使許多高性能CUDA應用程序成為可能的重要促成因素。

● 共享式二級高速緩存

GF100擁有一個768KB容量統一的二級高速緩存，該緩存可以為所有載入、存儲以及紋理請求提供服務。二級緩存可在整個GPU中提供高效、高速的數據共享。物理效果、光線追蹤以及稀疏數據結構等事先不知道數據地址的算法在硬件高速緩存上的運行優勢尤為明顯。后期處理過濾器需要多個SM才能讀取相同的數據，該過濾器與存儲器之間的距離更短，從而提升了帶寬效率。

統一的共享式緩存比單獨的緩存效率更高。在獨享式緩存設計中，即使同一個緩存被多個指令預訂，它也無法使用其它緩存中未貼圖的部分。高速緩存的利用率將遠低于它的理論帶寬。GF100的統一共享式二級高速緩存可在不同請求之間動態地平衡負載，從而充分地利用緩存。二級高速緩存取代了之前GPU中的二級紋理緩存、ROP緩存以及片上FIFO。

GF100的緩存架構讓各流水線之間可以高效地通信，減少了顯存讀寫操作

統一的高速緩存還能夠確保存儲器按照程序的順序執行存取指令。當讀、寫路徑分離（例如一個只讀紋理路徑以及一個只寫ROP路徑）時，可能會出現先寫后讀的危險。一個統一的讀/寫路徑能夠確保程序的正確運行，同時也是讓NVIDIA GPU能夠支持通用C/C++程序的重要因素。

與只讀的GT200二級緩存相比，GF100的二級高速緩存既能讀又能寫，
而且是完全一致的。NVIDIA采用了一種優先算法來清除二級緩存中的數據，這種算法包含了各種檢查，可幫助確保所需的數據能夠駐留在高速緩存當中。

4人已贊

第1頁：不可思議的存在：GTX590發布第2頁：第一章：NVIDIA GTX590產品解析第3頁：首發產品：華碩GTX590 第4頁：首發產品：索泰GTX590極速版第5頁：首發產品：映眾GTX590 第6頁：首發產品：七彩虹iGame590 第7頁：首發產品：銘瑄GTX590 第8頁：首發產品：盈通GTX590 第9頁：三大雙芯卡皇實物對比第10頁：第二章：GTX590游戲3D性能測試第11頁：DX10理論測試：《3DMark Vantage》第12頁：DX11理論測試：《3DMark 11》第13頁：Tessellation測試：《Heaven 2.1》第14頁：DX11理論測試：《石巨人》第15頁：DX11游戲測試：《塵埃2》第16頁：DX11游戲測試：《異形大戰鐵血戰士》第17頁：DX11游戲測試：《地鐵2033》第18頁：DX11游戲：《失落星球2》第19頁：DX11游戲：《H.A.W.X.2》第20頁：DX10.1游戲測試：《孤島驚魂2》第21頁：DX10游戲測試：《孤島危機：彈頭》第22頁：DX10游戲測試：《沖突世界》第23頁：DX9游戲測試：《街頭霸王IV》第24頁：PhysX測試：《黑手黨II》第25頁：CUDA視頻轉碼測試第26頁：溫度、功耗、噪音全面領先對手第27頁：性能測試總結第28頁：第三章：NVIDIA附加圖形技術之靈活應用第29頁：特色技術應用：NV 3D Vison Srround 第30頁：虛擬現實必經之路：CUDA光線追蹤第31頁：第四章：最強游戲即時渲染畫面賞析第32頁：DX10基準：《3DMark Vantage》畫面賞析第33頁：DX11游戲：《HAWX2》畫面賞析第34頁：DX11游戲：《地鐵2033》畫面賞析第35頁：Tessellation軟件：《Heaven》畫面賞析第36頁：Tessellation軟件：《石巨人》畫面賞析第37頁：DX11基準：《3DMark11》畫面賞析第38頁：第五章：令人興奮的DirectX API發展歷程第39頁：號稱實現“一切圖形特效”的DX9C 第40頁：不應備受冷遇的DX10 第41頁：第六章：揭秘DX11技術革新第42頁：DX11五大革新之：Shader Model 5.0 第43頁：DX11五大革新之：Multi-Threading 第44頁：DX11五大革新之：Texture Compression 第45頁：第七章爭論漩渦中心的Tessellation 第46頁：Tessellation（曲面細分）的前世今生第47頁：Tessellation不僅僅會“細分曲面第48頁：當Tessellation遭遇“法線貼圖”第49頁：曲面細分究極奧義動起來更精彩第50頁：當Tessellation遭遇“物理運算”第51頁：第八章：DX11核心技術：DirectCompute11 第52頁：CUDA和Stream之爭的內幕第53頁：DirectCompute 10/11版本間的區別第54頁：DirectCompute11的妙用：順序無關透明第55頁：DirectCompute11的妙用：電影級景深第56頁：DirectCompute11的妙用：高清晰環境光第57頁：第九章：GF100/110圖形架構深入解析第58頁：GF100構架八倍于上代旗艦的幾何性能第59頁：GF100/110和Cayman圖形架構對比第60頁：GF100/110圖形架構：強大的多形體引擎第61頁：GF100/110圖形架構：第三代流處理器第62頁：GF100/110圖形架構：精兵簡政的紋理單元第63頁：GF100/110圖形架構：一級緩存與二級緩存第64頁：GF100/110圖形架構：光柵單元高倍抗鋸齒第65頁：第十章：適合并行計算的Fermi架構第66頁：Fermi計算架構：GPU的未來是并行計算第67頁：Fermi計算架構：高效的雙精度性能第68頁：Fermi計算架構：首次支持C++編程第69頁：Fermi計算架構：首次支持顯存ECC 第70頁：Fermi計算架構：NVIDIA Nexus開發平臺第71頁：全文總結：該勝不勝與當敗不敗第72頁：附錄：追尋那些曾經的雙核卡皇第73頁：Rage Fury Maxx——曙光女神第74頁：曇花一現的挑戰者——XGI Volari V8/V5 第75頁：不為人知的經典——雙核心9800Pro 第76頁：普及雙核心——影馳雙核7600GT 第77頁：GeForce 7950GX2——雙拳出擊誓奪王位第78頁：ATI雙核心——Gemini技術第79頁：雙G92核心的怒吼——GeForce 9800GX2 第80頁：55nm王者——GeForce GTX 295

決戰性能之巔！NV雙芯旗艦GTX590評測

關注我們