三世同堂!DX10/10.1/11游戲效率對決
泡泡網顯卡頻道12月23日 三個月前,AMD重磅發布了HD5800系列顯卡,除了其強大的性能外,更令人期待的是其支持微軟全新的DX11。如果說HD4000是AMD的翻身之作的話,那么HD5000就是揚眉吐氣的力作,一連串的反擊打得對手毫無還手之力!
與之前中端卡上市時間較高端卡晚半年左右的不成文規則不同,此次AMD一口氣將HD5000系列的高中端一起上市,且可根據市場變化,下個月就讓面向低端用戶設計的HD5600系列上市。這樣的話,DX11顯卡并非高不可攀,對DX11的硬件支持已不是障礙。目前DX11游戲并不是多,但比起當年DX10的情況要好很多,優秀的技術必然受到大家的追捧,DX11也不例外,DX11已經是大勢所趨。
HD5000全面上市之后,目前的顯卡市場格局就比較混亂了,ATI方面是DX11和DX10.1顯卡共存,而NVIDIA方面中高端依然堅守DX10的陣地,低端才剛開始引入DX10.1支持,這就出現了罕見的DX10、10.1、11三代顯卡共存的局面。
DX10.1和DX11,相比DX10最大的改進就是提升渲染效率,充分發揮GPU和CPU的資源,消除瓶頸。那么DX11相比DX10.1能提升多少速度呢?DX10.1相比DX10有多大優勢呢?本文對此進行專項測試。
DX10帶來了眾多絢麗無比的新特效,“濫用”各種特效導致GPU不堪重負。而GPU自身的發展受到諸多因素的制約,如果制造工藝跟不上的話運算能力很難取得突破。因此,必須通過不斷改進架構運算效率來進一步提升3D圖形性能。在DX10之后,微軟也開始將重心集中在如何提升算法和效率上面,而不是一味的加入新特效或提高模型復雜度。
此后微軟發布了DX10.1 API,對DX10進行了小修小補,DX10.1主要更新內容有:

DX10.1的更新內容雖然不少,但相比DX10沒有什么革命性的改進,大部分內容都是提高GPU的資源利用率、將一些可選標準列為必須,其實不少項目DX10顯卡通過修改驅動就能實現。因此DX10.1沒能得到游戲開發商足夠多的重視,并沒有像當年的DX9C那樣迅速成為主流。

屈指可數的DX10.1游戲
ATI從HD3000系列開始,也就是第二代DX10顯卡中,就全面提供了對DX10.1 API的支持。而對手NVIDIA則對于DX10.1比較抵觸,第二代GF9系列和第三代GTX200系列都不支持DX10.1,并且宣稱“DX10.1并非必須,DX10也能部分實現”之類的言論?!洞炭托艞l》這款原本支持DX10.1的游戲也迫于壓力在新版本中取消了支持。
但是,NVIDIA剛發布的GT210/220/240顯卡卻非常低調的對DX10.1提供了支持。在DX11時代即將來臨之際,NVIDIA沒有將抵制DX10.1的策略進行到底,而選擇了妥協,真是令人費解。
至少,NVIDIA用實際行動證明了,DX10.1雖然改進有限,但也并不是沒用。實際上,DX10.1只不過是微軟的一個試水石,其目的非常明確,那就是盡可能的提高DX10的渲染效能,達到節約GPU資源的目的,而DX11正是基于這種設計理念而來的。
從游戲畫面逼真度來看,短期內恐怕沒有哪款游戲能夠達到Crysis的高度,但是這款依靠暴力模型、著色技術和諸多特效堆積而成的游戲,對顯卡的要求之高令人嘆為觀止,至今都沒有哪顆GPU敢打包票說能在最高特效下面流暢運行。也就是說Cryengine 3是絲毫沒有考慮現有GPU的性能而開發的一款超級引擎。

虛幻3是最高效最成功的引擎,Cryengine只是畫面最強的引擎
以高效率著稱的虛幻引擎締造者Tim Sweeney稱,想要把現有游戲模型復雜度提高數十倍是很容易的事情(比如CG模型和影視渲染),但同樣的你也需要數十倍與現有主機機能的顯卡才能流暢運行,比如三路甚至四路優異系統,而這種系統的市場占有率連1%都不到,獨孤求敗的Crysis還賣不過快餐式的使命召喚系列、Cryengine至今無法染指游戲機領域就是這個道理。
所以,架空硬件的引擎是不可取的,唯有充分利用有限的GPU資源,通過各種輔助技術最大化畫面表現力,才是圖形技術公司和游戲開發商首當其沖要解決的內容。
因此,在DX10發布四年、成為主流之后,業界將期望都寄托在了DX11身上,雖然DX11并沒有帶來全新的特效,但卻通過各種手段提升了GPU的渲染效率,當GPU有了富裕的運算資源之后,游戲開發商就可以大膽的去使用更多的特效和技術,如此一來DX11游戲很容易就能從畫面到速度全面超越DX10游戲!
DX11最關鍵的特性有以下五點:
1. Tessellation:鑲嵌式細分曲面技術(第三章做專門解析)
2. Multi-Threading:多線程處理
3. DirectCompute 11:計算著色器(第二章做專門解析)
4. ShaderModel 5.0:著色器模型5.0版
5. Texture Compression:紋理壓縮


在DX11的五大關鍵特性中,其中有四項都是專為改進效率而生,所以我們就通過新款DX11游戲來看看,效率究竟能提升多少?
DX11/DX10.1介紹完畢,現在就來看看性能如何,畢竟DX11和DX10.1主要改進的是性能而不是畫質。
● 測試平臺:
|
PCPOP.COM評測室 | |
|
硬件系統配置 | |
|
|
Intel Core 2 Extreme QX9770 |
|
主 板 |
MSI X48C Platinum |
|
顯 卡 |
HD5870 1GB (850/4800MHz) |
|
內 存 |
Apogee DDR3-1600 (9-9-9-24-1T) |
|
硬 盤 |
日立1TB |
|
電 源 |
Tt暗黑650p |
|
軟件系統配置 | |
|
操作系統 |
Windows 7 RTM 7600.16385 32Bit |
|
DirectX |
Directx_aug2009_redist |
|
顯示驅動 |
NVIDIA Forceware 195.65WHQL ATI Catalyst 9.11WHQL |
● 測試方法:
使用最新的《鷹擊長空》、《潛行者》、《BattleForge》游戲,通過打開關閉DX11或者DX10.1模式,對比不同API下的性能有無差別。
● 測試目的:
測試DX11/DX10.1/DX10三種模式下的性能差別,檢驗DX11顯卡和DX10.1顯卡性能提升。
● 首款DX11游戲——BattleForge
作為HD5800發布當天同步支持DX11的游戲,BattleForge雖然沒有帶來任何新的特效,但卻依靠DX11模式有效的提升了性能。
BattleForge測試中,特效全開最高,SSAO設定為VeryHigh時其實就已經是HDAO技術,然后對比HD5870在DX11和DX10.1模式下的性能。

雖然DX11帶來的畫質提升幾乎看不出來,但游戲運行效率的提升令人驚訝不已!從1680到2560分辨率,從0AA到8AA,12種模式下都有極為可觀的幀數提升。
很多RTS游戲都會將幀數鎖定在30幀,保持不低于25幀的速度即可認為是流暢。通過上表來看,HD5870可以在2560 8AA這種最優異模式下保持25.6幀的平均速度,真是難能可貴,這當然都是DX11的功勞,因為在DX10.1模式下只有21.7幀,不要小瞧了4幀之差,這可是質的提升。
DX11 2560 8AA的性能等同于DX10.1 2560 4AA,可見DX11高效率的特性既可以給玩家帶來更快的運行速度,也能帶來更高的畫質。
● 第二款DX11游戲——《潛行者:普里皮亞季的呼喚》
第二款DX11游戲同樣主要是改進了效率,當然也加入了Tessellation技術的支持,但僅在人物模型上使用了該技術,所以畫面改進并不大。
游戲提供了DX11和DX10兩種渲染模式,通過自帶的Benchmark測試可以直接獲得兩種模式下的性能差別到底有多大:


無論是否開啟抗鋸齒,DX11都能獲得十分可觀的性能提升,以目前最便宜的DX11顯卡HD5750為例看看提升幅度:

從數據分析,DX11較DX10.1效率更高已經是事實,且提升效率可以用顯著來形容。這一次,顯卡終于可以通過非晶體管堆積的方式獲得性能提升了。
● 首款DX11游戲——BattleForge
BattleForge這款網游在支持DX11之前就能夠支持DX10.1,所以我們還可以用它來對比DX10.1和DX10的效率差別。
測試中,將SSAO設定為High,這就是傳統的SSAO效果,然后對比HD5870在DX10.1和DX10模式下的性能。

提升幅度雖然不如從DX10.1到DX11那么顯著,但也有意外收獲了,看來DX10.1絕非浪得虛名。
● DX10.1游戲——《鷹擊長空》

在《鷹擊長空》這款DX10.1游戲中,DX10.1的主要作用就是用來改進SSAO算法,因此開啟關閉DX10.1也能獲得20%左右的性能提升,與《BattleForge》DX10.1模式基本相同。

作為NVIDIA最新的DX10.1顯卡,GT240通過DX10.1模式也能提升一些性能,但幅度更小。DX10.1畢竟是半代更新的API,雖然也能提升效率,但遠不如DX11那么顯著,算是聊勝于無吧。
● DX10.1主要改進效率,未得到足夠重視
從2007年底的HD3000系列開始,ATI全線顯卡就已經對DX10.1提供了完整的支持。可惜DX10.1相對于DX10的改進不多,新增的特效“多重采樣算法”和“屏幕空間環境光遮蔽”,DX10硬件也能實現而且畫質完全相同,只不過效率稍低一些。正因為如此,顯卡是否支持DX10.1就沒那么重要了,最關鍵的是游戲性能。
以《孤島驚魂2》和《刺客信條》為代表的第一批DX10.1游戲,同級A卡并不比N卡強多少,由此導致DX10.1被眾人所無視。但在今年以《鷹擊長空》和《潛行者:晴空》為代表的新一代DX10.1游戲中,開啟關閉DX10.1性能可以相差20%之多,因此直到兩年后的今天DX10.1才受到了廣泛關注,可見新技術能否得到游戲的大力支持十分關鍵,因為顯卡更新換代頻率實在太快,而消費者大都是比較現實的。
終于,一向宣稱DX10.1無用的NVIDIA沒有將抵制策略進行到底,也在中低端顯卡GT210、GT220、GT240顯卡中加入了DX10.1支持,目的就是為了提升性能,增加賣點?;ê苄〉拇鷥r就能讓顯卡性能提升10-20%,何樂而不為呢?
● DX11革命尚未成功,游戲仍需努力
NVIDIA前腳剛邁入DX10.1,ATI就已經大踏步進入DX11時代了,HD5000系列的發布讓ATI揚眉吐氣,在中高端力壓對手。其實同價位的HD5000顯卡并不比N卡強多少,但新一代DX11 API的支持讓A卡增色不少,DX11的誘惑力顯然要比DX10.1大很多。
DX11主要有五項關鍵特性,其中的三項(多線程處理、計算著色器11、紋理壓縮)都是用來改進圖形渲染效率的,另外的兩項——SM5.0新增的指令可以帶來一些新特效,細分曲面技術可以讓模型更加細膩平滑。
DX11游戲來得比想象中還要快,HD5870發布當天《BattlaForge》這款RTS網游就同步升級至DX11,通過筆者的測試來看,DX11雖然沒有帶來新的特效,但卻讓速度提升了20%以上!可惜這款游戲只在歐美運營,對于國內玩家來說沒有任何意義。
第二款DX11游戲是《Stalker:COP》(潛行者:普里皮亞季的呼喚),它除了使用DirectCompute11改進渲染效率外(性能提升也在20%以上),還對人物模型應用了Tessellation技術,效果提升不少。
第三款DX11游戲是《DiRT2》(科林麥克雷:塵埃2),通過游戲的靜態截圖來看,DX11的五大關鍵技術在該作中都得到了體現,不過對于這款緊張刺激的賽車游戲來說,玩家在游戲過程中很難注意到DX11所帶來的觀眾、旗幟或水面的差別,DX11和DX9C的畫面區別并不大。
總的來說,目前游戲對于DX11技術的應用和DX10.1類似,主要還是集中在改進效能的方面,對于增強畫質的細分曲面和陰影技術使用率并不高,DX11的潛力還需要重量級大作來深度挖掘?!?
關注我們


