決戰性能之巔!NV雙芯旗艦GTX590評測
從HD4000時代開始,AMD改進ROP單元設計之后抗鋸齒效能大增,在標準的4xMSAA模式下已經與N卡不相上下,而在最高的8xMSAA模式下大幅領先于N卡。NVIDIA雖然提供了比較巧妙的高精度CSAA模式,但畫質方面還是比不上正統的MSAA,基于8xMSAA的更高級別8xQ AA與16xQ AA也毫無用武之地,因為N卡的8xMSAA效能偏低。
為了一雪前恥,NVIDIA在GF100當中重新設計了ROP單元(后端渲染單元,俗稱光柵單元)。主要是大幅提升了數據吞吐量與效率,上頁介紹過GF100的L2已經不再與ROP及顯存控制器綁定在一起,而且是全局共享的,因此存取效能與帶寬大幅提升。
9.7 光柵單元與32倍抗鋸齒
GF100的每個ROPs包括8個ROP單元,比GT200翻了一倍。這8個ROP單元可在一個時鐘周期類輸出8個32bit整數像素、4個16bit浮點像素或2個32bit浮點像素。原子指令性能也得到了大幅提升,相同地址的原子操作執行速度最高可達GT200的20倍,鄰近存儲區的操作執行速度最高可達7.5倍。
在GF100上,由于壓縮效率的提升以及更多ROP單元能夠更有效地渲染這些無法被壓縮的較小基元,因此8倍速多重采樣抗鋸齒(8xMSAA)的性能得到了大幅提升。
在上代架構中,由于ROP資源有限,在進行高倍抗鋸齒采樣的同時還執行渲染后端處理任務時(如SSAO、運動模糊、景深等),效率會非常低下。典型的比如《鷹擊長空》、《晴空》等等。
GF100不僅ROP資源非常豐富,而且可以在DirectCompute 11的幫助下減輕ROP部分的負載,提高執行效率,此時開啟高倍抗鋸齒就沒什么壓力了。
● 將CSAA精度提升至32倍,并優化算法實現更高畫質
解決了8xMSAA效率抵消的問題之后,NVIDIA在此基礎上更上一層樓,開放了更高級別的32x CSAA抗鋸齒模式,上代精品只能提供16xQ CSAA而且實用性并不高。同時新的抗鋸齒模式還優化了“透明覆蓋”(Alpha-to-Coverage)采樣的算法,實現更高的畫質:
受到API與GPU計算能力的限制,當今的游戲能夠渲染的幾何圖形數量還很有限。樹葉的渲染是一個尤其突出的難題。針對葉子的一種常用技術就是創建一個包含許多樹葉的透明紋理模版,利用“透明覆蓋”來除去樹葉之間的縫隙。覆蓋采樣的數量決定了邊緣的畫質。如果只有四個覆蓋或八個采樣,那么將會出現非常糟糕的鋸齒以及鑲邊現象,尤其是在紋理靠近屏幕的時候。采用32倍速覆蓋采樣抗鋸齒(CSAA),GPU共有32個覆蓋采樣,從而最大限度減少了鑲邊效果。
32x CSAA相比8x MSAA性能損失并不大,非常值得一試
透明多重采樣(TMAA)也能夠從CSAA中獲益匪淺。由于“透明覆蓋”不在DirectX 9 API當中,所以DirectX 9游戲無法直接使用“透明至覆蓋”。而TMAA恰恰對這樣的游戲有所幫助。取而代之的是,它們采用了一種叫做“透明測試”的技術,該技術能夠為透明紋理產生硬邊緣。TMAA能夠轉換DirectX 9應用程序中舊的著色器代碼,使其能夠使用“透明覆蓋”。而“透明覆蓋”與CSAA相結合,能夠生成大幅提升的圖像質量。
關注我們



