DX11性價比之王!GTX460雙雄權威評測
泡泡網顯卡頻道7月12日 在筆者的印象中,首款DX11顯卡HD5870/5850好像就是剛發布沒多久的新產品,可是將以前的首發評測文章翻出來之后才發現,原來這已經是九個月以前的事情了。之所以會產生這樣的錯覺,是因為AMD的HD5000系列顯卡自發布以來就基本上沒降價,而且一直在市場上保持的一定的熱度,這真是一件不可思議的事情。
HD5800系列在DX11時代唱了大半年的獨角戲之后,NVIDIA終于正式發布了GF100核心的GTX480/470顯卡,全新的架構、超強的曲面細分性能給大家留下的深刻的印象,但較高的功耗與發熱也成為揮之不去的陰霾,實際游戲性能也沒有帶來驚喜,讓很多NFan們扼腕嘆息。
GTX480/470以及后來發布的GTX465未能給HD5800系列造成多大的壓力,這是HD5000系列價格堅挺的主要原因。競爭力不足導致NVIDIA在DX10時代積累的優勢正在被對手追上,中低端產品線的青黃不接也讓NVIDIA損失了很多市場份額。
NVIDIA迫切的需要一款重量級DX11新品出來壓陣,這款顯卡必須在千元價位擁有超強的性能、合理的價格、在保留NVIDIA一貫優勢技術的基礎上、進一步增強功能、并控制功耗和發熱。這樣才能穩定AIC的軍心,證明NVIDIA在GPU領域的設計與研發實力。
這就是今天我們要評測的一款產品——GeForce GTX 460,基于NVIDIA最新的GF104核心,首發產品分為1GB 256bit和768MB 192bit兩個版本,官方定價是1499和1299元。他們將會徹底打破HD5000系列的防線,成為2010年度最具性價比的DX11顯卡。
第一章 NVIDIA與ATI截然不同的GPU設計理念
如果您以為NVIDIA與ATI這兩大圖形顯示巨頭只是在單純的拼技術與實力,那就大錯特錯了。技術方面是可以相互借鑒與學習的,而真正有趣的就是雙方在戰術和謀略方面的博弈,每一代產品之間的較量都可以用驚天地、泣鬼神來形容。
遠的不說,從DX10時代談起,看看雙方是如何規劃每一代產品的。
第一章/第一節 圖形架構設計思路:小修小補與重新設計
● ATI圖形架構設計思路:單純擴充流處理器規模,架構保持不變
從DX10到DX10.1再到DX11,轉眼間顯卡已經發展到了第四代,但有經驗的讀者應該可以發現,ATI的新產品只是在R600核心的基礎上添加新的ShaderModel指令集并擴充流處理器規模而已,對于GPU圖形架構的改進十分有限甚至原封未動。
Cypress核心架構圖:相當于并排放置了兩顆RV770
R600核心奠定了ATI最近四代GPU架構的基礎,我們知道R600是一顆非常失敗的核心,RV670也好不了太多,但它的架構卻在RV770和Cypress核心上面大放異彩。
從HD2000到HD3000,核心架構原封未動,只是為SIMD賦予了DX10.1(ShaderModel 4.1)指令集的支持,新工藝解決了功耗發熱過大的問題,但AA效能依然十分低下;
從HD3000到HD4000,SIMD規模增加了2.5倍,同時放棄了令人詬病的Shader AA和環形總線(顯存控制器),回歸了傳統的ROP AA和交叉總線,抗鋸齒效能恢復正常之后的HD4000性能表現非常優異;
從HD4000到HD5000,SIMD規模再次倍增,賦予DX11(ShaderModel 5.0)指令集的支持,并額外附加一些先進技術和功能,大獲成功!
ATI保持R600的架構不變,只是單純的擴充流處理器的規模,并緊跟微軟腳步第一時間對新API提供支持。這樣的做法有很大的優勢,那就是可以在很短的時間內完成新一代產品的研發,并迅速推向市場。
新產品由于運算單元數量的倍增,在老游戲中的性能也很不錯,在部分新游戲中的表現也算不錯,但在應用了大量新技術的DX11游戲中就差強人意了。
● NVIDIA圖形架構設計思路:新的API需要新的架構,為DX11重新設計
其實,此前NVIDIA方面也是如此,G92/GT200相對于G80也只是強化了并行計算架構,雖然對流處理器的排列組合做了一些微調,但整體架構沒有本質變化。到了DX11時代,NVIDIA認為舊的架構已經不適合新技術和新游戲的需要,有必要對GPU架構進行大幅度的改進、甚至是重新設計。
為GT200架構添加DX11和Tessellation支持是很容易的
實際上G80和GT200的架構也是非常優秀的,ATI即便有DX10.1的輔助,同時代產品都沒能占得任何便宜。ATI沿用R600的架構推出了DX11產品,按理說NVIDIA為GT200添加DX11支持也不是什么難事,性能也不會差,那為什么NVIDIA不這樣做呢?
因為NVIDIA發現了GPU新的瓶頸:從NV30到GT200核心,GPU的渲染能力提升了150倍,但幾何性能的增長居然連3倍都不到!這個問題此前未能得到重視,因為游戲中的幾何圖形轉換大多交給CPU來計算,而到了DX11時代,新增的Tessellation技術對GPU幾何圖形處理能力提出了新的要求,此時如果繼續沿用上代架構顯然會制約DX11性能,成為新的瓶頸!
GTX480的幾何性能達到GTX285的8倍之多!
于是GF100架構應運而生了,NVIDIA沒有像對手那樣以新瓶裝舊酒的方式加入DX11支持,而是將整個GPU架構推倒重來,完全針對DX11的特性而優化設計。GF100核心被劃分為模塊化設計,整顆核心擁有4個Raster Engine(光柵化引擎)和16個PolyMorph Engine(多形體引擎),從而保證了新一代的架構擁有十幾倍于上代產品的幾何性能和曲面細分能力,確保新一代產品擁有最強的DX11性能。
不過NVIDIA這樣的做法也有些超前,幾何性能和曲面細分性能確實是對手的十幾倍,但如此巨大的優勢并不能如愿以償的帶入實際DX11游戲當中,因為目前的DX11游戲還沒有大量使用這些尖端圖形技術。除了Benchmark和Demo之外,NVIDIA還需要新一代游戲的支持才能獲得更多游戲玩家的認可。
第一章/第二節 高端產品設計思路:小核心與大核心之戰
自GPU誕生以來,ATI和NVIDIA雙方都是使出渾身解數,先竭盡所能的制造出一顆最強的GPU,然后再去精簡規格和功能,衍生出一些中低端產品。而最強GPU的性能往往受制于半導體制造工藝、功耗和散熱設備,如果沒有這些客觀條件的限制,天知道他們會把GPU做成什么樣子。
圖例:如果用1000nm工藝制造Core i7,其核心面積將會有一本書這么大
● ATI高端產品設計思路:小核心打主力,雙核心稱王
R600的失敗有著多方面的原因,ATI始終認為架構方面是沒有問題的,問題出在制造工藝方面,核心漏電流太高導致功耗發熱十分恐怖,良品率太低導致產量有限,只能閹割了再賣。可是臺積電擁有的已經是當今非常先進的GPU制造技術,所以問題不在于臺積電,只可能出在自身——不應該把GPU設計的如此之大,超出了半導體制造工藝所能承受的范圍。
AMD的產品線設計思路
于是在R600之后,ATI痛定思痛,決定放棄沿用了數十年之久的大核心策略,首先制造一顆在制造工藝允許范圍內、晶體管規模適中、成本在主流中高端玩家可以接受的輕量級核心。這款產品將會是市場上的主流,經過精心的優化設計之后,良率和功耗發熱都必須控制得相當出色。
對于旗艦級產品也不放棄,使用兩顆核心通過CrossFire技術互聯起來,性能提升可達1.8倍,這樣的產品可以滿足廠商的虛榮心以及發燒游戲玩家狂熱的追求。
于是在接下來的三代產品中,ATI的小核心策略一步一步的走向成熟,NVIDIA所承受的壓力一代比一代大。RV670由于自身AA效能低下的問題無所作為,RV770則打了一場漂亮的翻身仗,Cypress的HD5970至今依然是王者。
● NVIDIA高端產品設計思路:小核心還是巨無霸?
其實NVIDIA很早就嘗過了小核心策略的甜頭,DX9C末代產品G71就是很好的例子,GF7900系列憑借很高的性價比和較低的功耗發熱,備受游戲玩家推崇,而ATI當時的X1900系列雖然擁有更強的實力,但市場表現一般,性能之王依然被雙G71核心的7950GX2奪走。
可是,DX10時代的G80核心取得了更大的成功,NVIDIA居然使用落后的90nm工藝制造出了一顆如此龐大的核心,真是讓人難以置信。R600的核心規模與G80相當,使用了更先進的80nm工藝都未能戰勝G80。
R600之后ATI開始轉型,NVIDIA也意識到了巨無霸核心的不足,開始有針對性的對GPU進行優化,這就誕生了規模較小的G92核心,這顆核心一連沿用了三代,單核心、雙核心、衍生品不計其數,是近年來最經典的作品。
GTX260與HD4870賣同樣的價錢,大核心顯然要吃虧一些
G71和G92這兩顆小核心的成功并沒有讓NVIDIA產生放棄大核心的念頭,下一代GT200依然是一顆巨無霸,性能表現非常出色,但成本居高不下。隨著RV770核心的HD4870發布之后,給GTX260造成了前所未有的壓力;雙RV770核心的HD4870X2,更是迫使NVIDIA不得不拿兩顆GT200b也制造出一款雙核心顯卡來與之抗衡,兩顆巨無霸的成本和難度可想而知,雖然主動權依然掌握在NVIDIA手中,但大核心策略首次顯露出疲態。
到了DX11時代,NVIDIA依然走大核心路線,GF100核心晶體管數高達30億,達上代GT200的兩倍以上,使用尚未完全成熟的40nm工藝,制造難度可想而知。GF100優秀的架構與先進的技術特性是毋庸置疑的,但不可避免的遇到了良率和漏電問題的困擾,導致功耗發熱較大,旗艦產品居然都不是完整規格。
NVIDIA當然也有自己的打算,堅持大核心策略的另一目的,就是要進軍HPC市場,為客戶設計運算能力最強的產品,按照客戶的要求定制產品(如顯存ECC、雙精度浮點運算)。想要用一顆核心去兼顧HPC與游戲兩個截然不同的市場,確實非常困難。
第一章/第三節 中端產品設計思路:一刀兩半與優化設計
有了高端產品撐腰之后,中低端產品的設計思路就非常簡單了,架構已經定型,無需再做什么修改,基本上就是把規格砍為1/2、1/4這樣一級級減下去,一系列產品都誕生了……
● 從Cypress(HD5870)到Juniper(HD5770):所有規格全部減半
以往的歷代產品,NVIDIA和ATI幾乎都是這樣做的。現在,ATI也還是這樣做的,HD5870與HD5770的關系就是如此:
Cypress與Juniper架構對比
通過架構圖來看,Juniper核心無論SIMD陣列還是ROP輸出部分都只有Cypress的一半,也就是說流處理器、紋理單元、光柵單元、一二級緩存、顯存控制器全部減半。Cypress很像是由兩顆Juniper組合而成的核心。
● 從GF100(GTX480)到GF104(GTX460):盡最大努力加強規格
按理說,NVIDIA也應該會把GF100核心的主要規格全部減半,從而制造出一顆擁有256SP 256Bit的主流核心。事實上之前國內外的媒體都是這樣猜測的,因為GF100模塊化四核心的設計,很容易將其“拆分為”規模大小不一的中低端核心:
如上圖所示,GF100為四核心設計,將它變為1/2、1/4就能輕而易舉的獲得中端和低端GPU,但NVIDIA卻沒有這樣做,最終GF104核心的規模出乎所有人的預料!
乍一看,GF104就是GF100被一刀切成兩半的規模,但請大家仔細看看到底有何不同?這里提醒大家一下:完整的GF100核心擁有512個CUDA核心,完整的GF104核心擁有384個CUDA核心,顯然GF104核心并非是GF100一半的規格,NVIDIA在微觀架構方面做了不小的改動,下一章筆者就為大家詳細分析NVIDIA為什么要這樣做。
第二章 GF104核心架構全解析
第二章/第一節 GF104核心SM架構的改進
相信細心的讀者已經看出來了,GF104相比GF100,最主要改變就是GPC(圖形處理器集群)從4個減至2個,顯存控制器從6個64bit(共384bit)減至4個64bit(共256bit),而最最重要的改變就是——
● 每組SM當中的CUDA核心數量從32個增至48個
按照常理來說,對于SM(流處理器簇)這一級的模塊,已經沒必要再重新設計或者進行調整了,直接保留GF100的設計,然后根據需要復制出一定的規模,新的核心就誕生了。但是在規格直接減半之后,雖然晶體管數和核心面積都會減半(參照Cypress與Juniper),但性能也會損失近50%,NVIDIA認為這并不是非常好的的方案。
那該怎么辦呢?我們知道,對GPU性能影響最大的模塊就是流處理器(CUDA核心),如果能在GPU內部盡可能多的塞入CUDA核心的話,性能方面就會有很大的提升。但是CUDA核心也會消耗不少的晶體管,如果晶體管數太過龐大的話,GPU制造成本、良品率、功耗、發熱也會受到較大影響。
那有沒有兩全其美的方法呢?大家可以注意看GF100芯片透視圖,其中間位置有1/3的面積,這些是GF100一體式的二級緩存。NVIDIA為了提升GPU并行計算的效率,像CPU那樣不惜成本的設計了大容量L2。L2對于性能的貢獻主要集中在密集型計算任務當中,而對于普通的圖形渲染來說,貢獻就非常小了。那么如果將這些L2的容量進一步壓縮,把節約出來的晶體管都變成CUDA核心的話,那么圖形渲染性能將會得到顯著提升。
GF104的SM要比GF100“胖”一些,CUDA核心橫向擴張
于是,擁有較小L2、較多CUDA核心的GF104就誕生了,新核心每組SM中包含CUDA核心的數量從32個增至48個,增加了50%,流處理器總數達到了384個。NVIDIA在晶體管數一定的情況下,通過優化核心與緩存的配比,制造出了一顆實力超乎預期的核心。
● 每組SM當中的紋理單元數量從4個增至8個
當然,NVIDIA也沒有單純增加CUDA核心的數量,針對GF100核心的不足之處也做了較大的改進——紋理單元數量加倍!
紋理單元數量加倍
GF100核心的每組SM當中擁有32個CUDA核心,還包括了4個紋理單元,這樣GF100總共就擁有64個紋理單元(GTX480屏蔽了一組是60個),遠少于Cypress的80個紋理單元。較少的紋理單元使得GTX400系列在大量使用了紋理貼圖的游戲中表現不佳,最有代表性的游戲就是《孤島危機》。
GF104核心只有8組SM,如果還是保持GF100的設計不變,那么紋理單元將只有32個,還沒有HD5770多(40個)。所以NVIDIA對紋理單元部分也做了改良,每組SM中的數量直接加倍,最終GF104擁有64個紋理單元,與GF100相等!
CUDA核心數量增加了50%,而紋理單元增加了100%,改進意圖顯而易見。
第二章/第二節 GF104流處理器效率的改進
● 每組SM中特殊功能單元數量從4個增至8個:
GF100每個SM內部還擁有額外的四個SFU(Special Function Units,特殊功能單元),可用于執行抽象的指令,例如正弦、余弦、倒數和平方根,圖形插值指令也在SFU上執行。
GF104每個SM內部CUDA核心數量增加50%之后,NVIDIA并沒有讓SFU數量也增加50%,而是像紋理單元那樣,直接翻倍,從4個增至8個。
SFU和Dispatch Unit數量加倍
每個SFU在一個時鐘周期內針對每個線程均可執行一條指令,一個Warp(32個線程)的執行時間可超過八個時鐘周期。SFU流水線從分派單元中分離出來,讓分派單元能夠在SFU處于占用狀態時分發給其他執行單元。復雜的程序著色器在特殊功能專用硬件上的運行優勢尤為明顯。
● 每組SM中指令分配單元從2個增至4個:
CUDA核心數量增加50%之后,并行線程調度器的負擔顯然將會更重,如果指令不能分配到每一個CUDA核心,那將會造成資源閑置,使得運算能力不如預期。NVIDIA意識到了這一點,于是直接將指令分配單元的數量加倍,由2個變為4個。
圖為GF100核心的Warp調度器和指令分配模式
現在,GF104的SM可對48個為一組的并行線程(又叫做Warp)進行調度。每個SM擁有兩個Warp調度器以及四個指令分派單元,這樣每個Warp周期可以并發執行兩條指令,每個SM一次可以執行四條指令。
第二章/第三節 GF104專為游戲玩家設計:刪除顯存ECC、去掉雙精度運算
GF100核心當中有很多功能都是普通用戶根本用不到的,比如顯存ECC、雙精度浮點運算和CUDA C++指令,這些技術和功能是NVIDIA為專業用戶而定制的。
● GF104刪除顯存ECC功能
GF100核心是第一顆在顯存中提供了基于糾錯碼(ECC)數據保護功能的GPU。GPU計算用戶使用ECC來在高性能計算環境中增強數據完整性。ECC是諸如醫療成像以及大型集群計算等領域中一個迫切需要的特性。
顯存ECC可以減少數據運算出錯的幾率,而對于圖形渲染來說,算錯幾個像素可能無傷大雅。所以GTX480系列都沒有用到顯存ECC功能,目前還只有Tesla系列支持顯存ECC,備受超級計算數據中心的親睞。
定位較低的GTX460就更不需要顯存ECC功能了,所以在GF104核心設計之初就直接被刪除。
● GF104精簡雙精度浮點運算能力
GF100相對于以往的GPU,大幅度改進了雙精度浮點運算能力,其效率達到了單精度浮點運算的1/2,而ATI全系列顯卡是1/5,NV上代顯卡是1/8。目前尚不清楚GF104核心到底是完全刪除了雙精度運算單元、還是降低了雙精度運算效率。無論是哪種方式,對于普通用戶來說都沒有任何影響,因為所有的3D圖形渲染和民用CUDA軟件都不會用到雙精度運算。
NVIDIA稱,沒有計劃使用GF104核心來制造Tesla GPU計算產品,事實上此前的Tesla都使用的是高端GPU。GF104是專門針對普通用戶和游戲玩家而設計的,并沒有“一心二用”的去兼顧HPC市場。
● GF104核心的二級緩存容量為512KB,與Cypress相等
GF100的二級緩存容量為768KB,GF104減少至512KB。如果平均下來GF100的每顆CUDA核心可以分到1.5KB的緩存,而GF104的每顆CUDA核心可以分到1.33KB的緩存,新核心的緩存配比略有減少。
二級緩存和顯存控制器是關聯的
不過即便如此,GF104核心512KB的L2容量也與ATI優異的Cypress相等。此外二級緩存容量還是與顯存控制器有一定的關聯關系。其中GTX460 1GB 256Bit的版本,L2可以使用全部的512KB,而768MB 192bit的版本只能使用到384KB L2。
GF100的緩存架構讓各流水線之間可以高效地通信,減少了顯存讀寫操作
緩存容量的減少,或多或少的會影響GPU的性能,3D圖形渲染也會有損失。但GF104繼承了GF100共享式的二級緩存設計,緩存利用率非常高,即便緩存容量遭到了縮水,也要比ATI獨享式二級緩存(L2綁定顯存控制器)的效率高。其原理大家可以參照CPU領域奔騰雙核與速龍2系列的性能表現即可。
第二章/第四節 GTX460并未使用完整版GF104核心,實力有所保留
前文通過冗長的篇幅詳細描述了GF104核心的誕生過程,大家就會理解NVIDIA的良苦用心了:居然對一顆次高端的GPU核心進行了重新設計,雖然沿用了GF100優秀的架構,但在微觀架構上進行了諸多改良,其最終目的就是以最小的代價,獲得最高的游戲性能,為挑剔的游戲玩家提供最具性價比的選擇。
● DX11中高端顯卡規格表:
這張規格表當中囊括了顯卡所有的關鍵參數,看起來可能比較費勁,這里就為大家重點強調幾個部分:
1. GTX460雖然流處理器數量少于GTX465,但默認頻率較高,最終浮點運算能力要比GTX465高30%;
2. GTX460的紋理單元數量與GTX470相等,比GTX465多12個;
3. 由于核心SM規模的減少,GTX460的多形體引擎(內含曲面細分單元)數量減少至7組,但依然遠高于HD5000全系列,因為A卡只有1個;
4. GTX460的TDP(設計功耗)要低于HD5830,1GB和768MB版本的功耗只有160/150瓦,NVIDIA終于徹底解決了惱人的功耗發熱問題;
5. GTX460分為1GB和768MB兩個版本,他們的區別不僅僅是顯存容量差了256MB,顯存位寬也少了64bit,造成顯存帶寬減少1/4,光柵單元減少1/4,二級緩存容量減少1/4,因為這些都與顯存控制器是相關聯的。
● GTX460 GF104核心圖:
NVIDIA此次并沒有公布GF104核心的芯片裸照,核心面積大小還是個迷。核心上面也安裝了金屬蓋,暫時無法看清其廬山真面目,官方提供的就只有這三張藝術照:
GF104核心最特別之處,就是GPU封裝基板居然是長方形的,而此前幾乎所有的CPU和GPU都是正方形或者接近正方形的。當然,其核心晶片部分,也是長方形的,看其架構圖就能略知一二:
● 兩款GTX460架構圖:
值得一提的是,GTX460所用的顯示核心并非GF104完整版,它被屏蔽了一組SM,這樣就少了48個流處理器、8個紋理單元和1個多形體引擎(內含曲面細分單元)。如下圖所示,被屏蔽的這一組SM有可能出現在任意八個位置之一。
另外GTX460 768MB版本還被屏蔽了一組顯存控制器,這個顯存控制器也可能出現在圖中任意四個位置之一。屏蔽顯存控制器的直接效果就是顯存位寬從256bit減至192bit、顯存容量從1GB降至768MB,連帶效果就是光柵單元從32減至24個、二級緩存從512KB減至384KB。
● GF104是G92再世?
NVIDIA的這種做法與當年的G92核心如出一轍,最先發布的8800GT(112SP 256Bit)并非完整版,此后才發布8800GTS(128SP 256Bit),還有進一步屏蔽流處理器和顯存控制器的8800GS(96SP 192bit)。次年改名為9800GTX,雙核心版本9800GX2成為新王者。至于9800GTX+還有GTS250等都是后話……
那么現在GF104的命運就可以想象了,其擁有384SP的完整版實力自然更加強大,GTX465/470/480等名號都已經被占用了,那么它很有可能被命名為GTX475,稍微提高頻率之后,實力超越GTX470和HD5870不無可能。
雙GF104核心可以組成NVIDIA的新旗艦,比如GTX495,也很有希望擊敗HD5970成為新的王者!
當然,以上都是筆者一時興起胡亂猜測,并不代表NVIDIA以及PCPOP的觀點,后面可以留給讀者更多的想象空間……
第三章 顯卡特色附屬功能的較量
在本文開篇第一章,筆者就曾提到過:“技術方面是可以相互借鑒與學習的”,在接下來的篇幅中,就為大家詳細介紹雙方在顯卡附屬功能方面的你追我趕。
第三章/第一節 GF104核心支持次世代音頻源碼輸出
首先我們回顧一下,自X1000系列之后,AMD將其顯卡命名為HD2000/3000/4000/5000系列,這個HD代表了兩層含義:GPU內置聲卡為HDMI提供音頻輸出、GPU內置UVD引擎支持高清視頻硬件解碼。其中HD2900XT首次內置聲卡,為HDMI提供音頻輸出;緊接著HD2600/2400開始內置UVD引擎,實現H.264和VC-1高清視頻完全硬解碼。
★ 高清視頻硬解碼之爭
從8600/8500開始,NVIDIA率先支持高清視頻硬解碼,但僅限于H.264編碼,對于VC-1依然是半硬半軟式,雖然也能流暢播放高清視頻,但比對手少一項功能終歸不是滋味。
NVIDIA一步步實現VC-1完全解碼
于是,從G98核心開始,NVIDIA將高清解碼引擎升級到VP3版本,為VC-1編碼提供了完全硬解支持,AMD的UVD引擎再也沒有值得驕傲的資本了。
NVIDIA隨后還提供了高清視頻雙流解碼技術,同時硬解兩部HDTV,支持藍光畫中畫功能。次年,AMD在HD4000系列GPU中升級至UVD2引擎,同樣支持雙流解碼和超高碼率視頻硬解碼。在互相攀比與學習的過程中,雙方在高清解碼方面的實力不相上下。
此外,NVIDIA可以通過CUDA計算技術動用流處理器資源進行高清視頻解碼加速,兼容性和畫質比專用的視頻引擎更勝一籌。而AMD在GPU通用計算方面比較落后,不支持該技術。因此綜合來看,在高清解碼的應用方面,還是NVIDIA更強一些。
★ HDMI音頻輸出之爭
但是NVIDIA還有個軟肋,HDMI音頻輸出還是需要“飛線”。當時的NVIDIA也意識到HDMI必將成為消費級市場的主流接口,雖然對HDMI也提供了支持,但其中的音頻信號必須從板載聲卡導入,安裝和設置都非常麻煩。NVIDIA的這種實現方法被稱為“飛線式”HDMI音頻輸出。
通過SPDIF為顯卡導入音頻信號
AMD針對GPU內置聲卡與HDMI一線式輸出技術進行了大肆渲染,搞得NVIDIA比較難堪。于是從GT220和GT210核心開始,NVIDIA終于內置了音頻模塊,為HDMI提供7.1聲道數字音頻輸出,終于擺脫了“飛線”的困擾。
但是,經驗老道的AMD又有了新的玩法,在HD5000時代對內置的音頻模塊進行大幅升級,如今HD5000全線顯卡都能夠通過HDMI接口向AV功放輸出7.1聲道音頻,除了傳統的AC-3、AAC外,首次支持次世代的Dolby TrueHD和DTS Master Audio源碼輸出!
這是歷史上第一次通過顯卡為功放輸出未經壓縮的源碼音頻流,此前必須使用價值不菲的中高端聲卡才能實現。雖然玩高清與HiFi的畢竟是少數人,國內玩家更是少之又少,但AMD的這一做法得到了高清玩家的高度贊賞,好評如潮!
免費附送的功能總比沒有強吧,相信很多用戶都是這種心態,尤其是在媒體的大肆渲染之下。以NVIDIA的設計實力,不是做不出來,而是想不想做的問題。于是在全新設計的GF104核心中,NVIDIA加強了HDMI Audio,支持Bitstreaming Dolby True HD和DTS-HD Master。如此一來,HD5000系列的一大技術優勢將不復存在。
事實上,在GF104之前,還有一款顯卡也能支持次世代音頻源碼輸出技術,那就是Intel內置在Clarkdale核心(Core i5 6XX和i3 5XX)里面的GMA HD集成顯卡,這款顯卡及其高清技術都是免費附送的。真正需要用到該功能的玩家未必會使用AMD、Intel或NVIDIA的顯卡,所以筆者認為HDMI Audio之戰純粹是王者的意氣之爭,就是為了堵上競爭對手的嘴。
第三章/第二節 3D立體時代來臨,3D Vision搶得先機
早在一年半以前,NVIDIA就正式發布了3D Vision立體顯示技術,并且聯合顯示器廠商推出了120Hz的3D顯示器,為廣大游戲玩家帶來了真正切實可用的3D立體解決方案。到了今年,多部重量級3D電影巨作的上映,讓更多的用戶一睹立體顯示的震撼效果,直接推動了3D立體的需求,2010成為了3D立體元年。
確實,3D游戲發展至今,畫面很難會有質的提升,但3D Vision技術的引入可以給人眼前一亮的感覺,可以說又是一場視覺革命:
NVIDIA經過多年的發展,產品和技術方面已經非常成熟了,目前幾乎所有的PC游戲都能近乎完美的支持3D Vision技術,配以3D眼鏡和120Hz顯示器的話,就能得以完美呈現。此前之所以未能得到普及,是因為用戶了解還不夠多,另外3D顯示設備量價都不如人意,而現在時機成熟了。
如今,所有的PC游戲都能支持3D Vision技術,所有的2D普通電影都可以通過PowerDVD搭配CUDA技術實時虛擬成3D影片,片源也不再是問題。加之今年3D顯示器如雨后春筍般出現在市場上,價格已經貼近主流,普通用戶組建一套3D PC不再是癡人說夢。
三屏3D構建夢幻游戲平臺
據黃仁勛先生稱,2010年南非世界杯的3D轉播全部使用NVIDIA解決方案,由NVIDIA GPU驅動,可見3D Vision技術已經獲得了業界的一致認可,引領整個行業快速進入3D立體時代!
NVIDIA的3D立體設置與顯卡驅動設置渾然一體,非常容易上手
AMD必須借助IZ3D第三方驅動解決方案
在上月的臺北電腦展上,AMD也正式公布了基于Radeon顯卡的3D立體解決方案,該技術與NVIDIA類似,也需要120Hz顯示器和液晶分時眼鏡的支持,而使用的驅動引擎為IZ3D的第三方解決方案。
在實現的立體效果方面,雙方并沒有太大的差別,但本質區別就是:NVIDIA的驅動研發團隊經過多年的積累,對于3D游戲的支持度和立體優化遠勝第三方解決方案,無論開啟3D立體后的性能表現還是對于游戲的支持數量都有著明顯優勢,針對新游戲也能第一時間提供優化支持,這些都遠非第三方解決方案可比。
現在AMD借助IZ3D的力量也邁入了3D立體的殿堂,但實際上IZ3D驅動也能完美兼容N卡。所以在3D立體方面,AMD無論解決方案、游戲效果、游戲兼容性和支持力度,都無法同3D Vision相提并論!
第三章/第三節 不支持單卡多屏怎么辦?SLI三屏3D
AMD HD5000系列最誘人的技術恐怕就是Eyefinity了,實現三屏環幕的效果確實相當震撼,為游戲玩家提供了非常寬闊的視野。當然這里說的三屏并不是簡單的連接三個顯示器,而是將三個顯示器虛擬成為一個大的分辨率,然后實現超寬分辨率的游戲,這才是玩家最需要的技術。
AMD的GPU在設計之初就考慮到了多屏輸出的需要,Cypress核心最多可以提供6個TMDS數字輸出通道,Juniper核心最多也能提供5個TMDS。不過實現5屏或者6屏輸出只能通過DisplayPort接口實現,使用傳統的Dual-Link DVI輸出的話,最多只能支持三屏,目前市售HD5000系列都是三屏輸出的配置。
6個TMDS通道最多提供6路DP輸出,或者3路DVI輸出
遺憾的是,NVIDIA新一代的GF100和GF104核心都不支持單GPU多頭(三屏以上)輸出技術,可能是實現該技術需要對GPU輸出模塊進行較大的改動,因而來不及加入該功能。但AMD Eyefinity技術目前被炒得火熱,該技術不但實用而且非常適合發燒游戲玩家,如果N卡不支持的話會喪失一個非常大的賣點。
為了彌補顯示輸出方面的不足,NVIDIA靈機一動,雙顯卡不是可以提供四頭輸出嗎,此前只能單純組建多頭輸出,而不能實現超大分辨率。如果使用雙顯卡,結合SLI技術、并把多頭輸出合并為大分辨率的話,那就能實現媲美Eyefinity的效果。最終,NVIDIA在不更改硬件的情況下,通過改寫SLI驅動,使得雙卡能夠實現與ATI完全相同的三屏環繞輸出。
NVIDIA的三屏需要雙卡SLI支持
NVIDIA這種解決方案的缺點就是需要兩張顯卡才能實現,但優點就是顯卡并沒有限定非得用剛剛發布的GTX400系列,上一代的顯卡也可以,只要組成SLI即可。還有個好處就是SLI系統性能比較強勁,足以帶動大分辨率玩BT游戲。
Eyefinity的優勢就是單顯卡也能支持三屏輸出,只需要2D輸出的用戶可以通過較低的成本組建。但對于3D游戲玩家來說,即便HD5870單卡也未必能夠勝任三屏幕玩主流游戲的苛刻要求,此時玩家可能需要購買兩塊顯卡,那么A卡和N卡在功能上就沒有優劣之分了,都能提供很完美的三屏效果。
驅動和軟件方面是NVIDIA一貫的優勢,NVIDIA的SLI環繞配置界面比AMD的Eyefinity更加智能方便,而且不需要DP顯示器的支持。AMD的Eyfinity驅動配置起來稍嫌麻煩,還必須要求一個顯示器支持DP接口,否則將不能實現三屏輸出,限制確實比較多。
新驅動還支持邊框矯正技術,操作同樣簡單方便易上手,讓多顯示器輸出的效果更加接近于真實世界中的窗格。使用邊框修正之后,游戲的顯示分辨率將會更加開闊。該技術AMD的Eyefinity現在也能支持,這一方面雙方做的都不錯。
NVIDIA可以實現2D三屏與更高級的3D三屏
當然,最具有特色的就是,三屏環幕結合3D Vision技術,實現3D立體3屏環繞技術,足以產生令人震驚的顯示效果。目前AMD的三屏3D技術還停留在實驗室和展示階段,因為3D顯示器必須要求使用Dual-Link DVI接口或者HDMI 1.4接口傳輸雙倍的數據流,普通的A卡還不能支持。
第三章/第四節 AMD至今無法染指的領域——GPU物理加速
PhysX是NVIDIA的一大法寶,在NVIDIA DX11顯卡面世之前,舊的N卡正是憑借該技術與A卡相抗衡。通過筆者此前的網友調查來看,雖然PhysX的關注度沒有DX11那么高,但還是擁有很多忠實的用戶,一些玩家為了同時追求DX11與PhysX,費盡心機通過破解雜交的方式來讓N卡和A卡協同工作。
《地鐵2033》:同時支持DX11和PhysX
如今GTX480/470正式發布,同時支持DX11和PhysX,玩家沒必要再瞎折騰了。而且剛剛發布的《地鐵2033》這款游戲對DX11和PhysX都提供了支持,看來不光是玩家,開發商對于PhysX也比較熱衷,畢竟這是目前唯一一款支持GPU加速的物理引擎,而另一款物理引擎Havok在被Intel收購之后一直處于雪藏狀態,只支持CPU加速,不支持GPU加速,物理效果都是輕量級的,遠不如PhysX那么夸張驚人。
此前想要實現物理效果必須購買專用的物理加速卡,而NVIDIA收購了Ageia公司之后,將PhysX技術以完全免費的形式附送給了GeForce顯卡,讓N卡用戶多了一個非常炫的功能。
NVIDIA在游戲界有著舉足輕重的影響力,和眾多游戲開發商保持著密切的合作關系,大名鼎鼎的“The Way”計劃就保證了N卡在幾乎所有游戲大作中都有著良好的性能發揮。PhysX物理引擎被NVIDIA收入囊中之后,原本屈指可數的物理游戲逐漸開花結果,以《鏡之邊緣》、《蝙蝠俠》、《黑暗虛空》為代表的一些重量級大作開始使用PhysX物理引擎,影響力非同小可。
國產FPS網游MKZ中爆炸、破壞、玻璃和布料使用了PhysX技術
而且,中國本土游戲開發商也開始使用PhysX引擎來增強畫面,比如《MKZ鐵甲突襲》和《劍網3》都內置了PhysX支持,可見PhysX技術顯然要比其它同類物理技術更易用一些。
國產網游《劍網3》中,使用PhysX實現了逼真的衣物和布料效果
雖然物理加速技術還沒有一個統一的標準,但PhysX無論從游戲數量還是畫面效果方面,都更勝一籌。隨著使用PhysX引擎的游戲越來越多,少有的PhysX顯然將會成為事實上的標準。
新發布的GTX480/470/460系列顯卡在PhysX加速方面的性能有了長足的進步,但NVIDIA上一代顯卡如果單獨拿來做物理加速卡的話,性能也很足夠,特效也不會損失,因為PhysX考驗的是CUDA并行計算效能,與DX API支持度無關。然如果N卡用戶想要升級到GTX480/470的話,舊顯卡沒必要淘汰。
AMD目前的處境比較尷尬,此前過多的依賴于Havok引擎,希望新版的Havok FX引擎能夠早日面世,為A卡提供支持。但是Intel收購之后希望主要使用CPU加速物理效果,導致AMD一籌莫展,之前一些AIB廠商宣稱A卡能夠支持Havok GPU加速純粹是無稽之談。此后AMD尋求第三方合作伙伴的支持,積極加入開源物理加速項目,但目前還沒有什么實質性的進展,至今沒有任何一款游戲能夠支持AMD的GPU加速物理。
第三章/第五節 特色功能之戰:CUDA遙遙領先于Stream
提起GPU通用計算,自然會讓人想到NVIDIA的CUDA、ATI的Stream以及開放式的OpenCL標準,再加上微軟推出的DirectCompute,四種技術標準令人眼花繚亂,他們之間的競爭與從屬關系也比較模糊。
首先我們來明確一下概念:
1. OpenCL類似于OpenGL,是由整個業界共同制定的開放式標準,能夠對硬件底層直接進行操作,相對來說比較靈活,也很強大,但開發難度較高;
2. DirectCompute類似于DirectX,是由微軟主導的通用計算API,與Windows集成并偏向于消費領域,在易用性和兼容性方面做得更出色一些;
3. CUDA和Stream更像是圖形架構或并行計算架構,NVIDIA和ATI對自己的GPU架構自然最了解,因此會提供相應的驅動、開發包甚至是現成的應用程序,通過半開放的形式授權給程序員使用。
其中ATI最先提出GPGPU的概念,Folding@Home和AVIVO是當年的代表作,但在被AMD收購后GPGPU理念擱淺;此后NVIDIA后來者居上,首次將CUDA平臺推向市場,在這方面投入了很大的精力,四處尋求合作伙伴的支持,并希望CUDA能夠成為通用計算的標準開發平臺。
NVIDIA CUDA架構示意圖
在NVIDIA大力推廣CUDA之初,由于OpenCL和DirectCompute標準尚未定型,NVIDIA不得不自己開發一套SDK來為程序員服務,這套基于C語言的開發平臺為半開放式標準(類似與Java的授權形式),只能用于NVIDIA自家GPU。AMD始終認為CUDA是封閉式標準,不會有多少前途,AMD自家的Stream平臺雖然是完全開放的,但由于資源有限,對程序員幫助不大,因此未能得到大量使用。
ATI Stream示意圖
DX11時代我們迎來了微軟的DirectCompute 11和OpenCL這兩大GPU計算API,其定位就相當于3D圖形領域的DirectX和OpenGL。就如同GPU能同時支持DirectX與OpenGL那樣,NVIDIA和AMD對DirectCompute和OpenCL都提供了無差別支持。
我們希望新API的出現能夠打破目前GPU計算領域混亂的格局,并帶來更多實用的應用和軟件,但從目前的發展方向來看,進展還是相當緩慢。當前主流的一些GPU計算類軟件,主要還是集中在視頻轉碼和編輯方面,都是以NVIDIA和AMD的CUDA/Stream技術為主。
就拿視頻轉碼來說,ATI驅動集成的AVIVO轉碼器功能太過簡單,轉換后視頻的畫質很差,而且主要依靠CPU轉碼,跟GPU的關系不大。而NVIDIA的Badaboom完全依靠GPU轉碼,GTX480的性能都能完全釋放出來,MediaCoder更是能夠充分發揮出CPU和GPU的效能,成為目前轉碼速度最快的軟件;MediaShow能同時支持A卡和N卡,主要依靠CPU轉碼,對GPU的要求很低,雙方性能差距并不明顯。
而在視頻編輯和應用方面,目前視頻倍線軟件和2D轉3D的軟件能夠同時支持CUDA和Stream技術,但一般都是等支持CUDA大半年之后,才加入對Stream的支持。此外還有一些加密解密、視頻修復軟件只支持CUDA不支持Stream,很顯然AMD對于GPU計算方面投入的精力還不夠多,支持Stream的軟件無論數量還是質量都跟CUDA相差一大截。
第四章 GeForce GTX 460顯卡實物解析
介紹完GF104核心架構和技術特點之后,下面我們就來看看基于GF104核心的首款顯卡——GeForce GTX 460,此次同一個型號有兩個不同的版本,首先我們看看1GB的版本:
第四章/第一節 NVIDIA公版GTX460 1GB顯卡實物拆解
NVIDIA公版卡的造型再次改變,公版散熱器不同于以往任何一款產品,黑色的外殼略微有些內凹,中間鑲嵌一個7CM的風扇。
散熱器并非GTX480/470/465那樣的渦輪風扇+側吹風道式散熱結構,因為渦輪風扇功率比較高、噪音比較大,雖然可以將GPU發出的全部熱量排出機箱之外,但散熱效率較低、噪音較大。
由于GF104核心發熱較小,沒必要非得使用側吹風道式結構將所有熱量排出機箱外,使用散熱效率更高的直吹式結構更有利于控制風扇轉速和噪音。取下散熱器之后我們可以發現,散熱片部分為太陽花式結構,通過兩條熱管輔助將熱量快速傳導至散熱片邊緣,然后大口徑風扇將熱量帶走,其中一半熱風可以被排出機箱外,另一半將殘留至機箱內。直吹式結構還有個好處就是風扇可以輔助顯存、供電和PCB散熱。
公版PCB的做工用料中規中矩,核心三相加顯存一相,需要兩個6Pin PCIE輔助供電接口。據NVIDIA稱其實GTX460只要一個6Pin輔助供電就夠了,之所以設計兩個,是為了超頻玩家而準備的,GTX460的超頻能力非常強,但超頻后功耗也會同比提升。
GF104-325核心擁有336個流處理器,默認核心/CUDA頻率是675/1350MHz
GF104核心比較奇特之處就是GPU為長方形,而此前NVIDIA和ATI所有GPU都是正方形的。特殊的設計使得顯卡散熱器四個定位孔也呈長方形分布,幾乎所有的第三方散熱器都無法兼容GTX460顯卡。好在NVIDIA公版散熱器散熱能力和噪音表現都非常好,沒有必要更換散熱器,就連AIC的一些非公版顯卡,都直接使用了這個公版散熱器。
顯存為常見的三星GDDR5顆粒,0.5ns的規格理論頻率為4000MHz,GTX460的默認顯存頻率是3600MHz,一般情況下可以超至4000MHz,但想要沖擊更高頻率就難了。目前NVIDIA的GDDR5顯存控制器還是沒有AMD做得好,沖擊高頻率難度較大。
輸出接口部分,GTX460與GTX480\\GTX470\\GTX465完全相同,都是兩個Dual-Link DVI搭配一個Mini HDMI接口。由于PCI擋板空間實在沒有位置,所以才勉為其難的設計了一個小HDMI。
現在GTX460已經可以支持通過HDMI輸出未經壓縮的次世代音軌,在功能上與HD5000系列沒有區別。據稱公版卡的HDMI接口還是1.3a標準,如果AIC廠商愿意的話可以設計成支持3D立體的1.4標準,但需要支付一定的認證費用,因此成本會有所增加。
第四章/第二節 NVIDIA公版GTX460 768MB顯卡實物拆解
GTX460 768MB與1GB的版本幾乎完全相同:PCB設計、散熱器、供電、默認頻率等等。唯一的不同就是少了兩顆顯存:
在不拆顯卡散熱器的情況下,區分GTX460 1GB與768MB的方法就是看顯卡背面PCB上的元件,在八顆顯存的對應位置,如果有元件空焊的情況,那么就肯定是768MB的版本。取下散熱器就能看出端倪:
NVIDIA公版GTX460 1GB(上)對比768MB(下)
很明顯,GTX460 768MB版本比1GB版本少了兩顆顯存,當然兩者的差別不僅僅是顯存容量少了256MB、顯存位寬少了64bit這么簡單,其光柵單元數量和二級緩存容量都有所減少,因此性能損失會比較多。
兩款不同的GTX460 768MB對比
而且,筆者還發現不同廠商的GTX460 768MB,其顯存空焊位并不相同。這兩個空焊位并不是廠商想空哪就空哪,而是由核心代號決定的。GTX460 1GB的核心代號是GF104-325,代表4個64bit顯存控制器都是完好的,而GTX460 768MB的核心代號是GF104-300,代表顯存控制器有屏蔽,具體屏蔽的是哪一個,看后綴:
后綴KA代表屏蔽右下角的一個64bit顯存控制器,這兩顆顯存就必須空著,焊上也沒用。KB代表屏蔽右上角的一個64bit顯存控制器,同理還會有KC、KD的型號。每個顯存控制器在GPU背面所連接顯存的針腳是固定的,所以屏蔽之后就必須在相應的位置空焊。
其他方面,GTX460 1GB版本和GTX460 768MB版本沒有任何區別。
第四章/第三節 首批GTX460顯卡:索泰1GB和768MB
● 索泰GTX460 1GB● 索泰GTX460 768MB
索泰的兩款GTX460都是標準的NVIDIA公版設計,1GB版和768MB版長得一摸一樣。只在顯卡背面的條碼處寫了是1GB還是768MB的版本,當然也可以通過看空焊位的方式來判斷。
第四章/第四節 首批GTX460顯卡:七彩虹非公版1GB
● 七彩虹iGame GTX460 1GB:供電大幅加強
七彩虹率先送測了自行研發的非公版設計GTX460 1GB版本,為iGame系列產品最新成員。其散熱器采用了公版設計,因為這個公版散熱器的效能和噪音表現確實非常出色,但其PCB和供電設計完全不同:
盡管從外觀上看,iGame GTX460 1024M和公版產品并沒有任何區別,不過這款產品的確是一款貨真價實的非公版產品。那么下面我們就來看看這款產品究竟有什么特別之處。
取下散熱器就可以看到:
實際上這款產品與公版產品的最大不同就在于供電部分。此款產品的供電部分采用了6相核心供電,相比公版增加了一倍之多。在用料部分采用了電磁屏蔽性能更高的0.56μH超薄鐵氧電感。
供電MOS管則采用了日系廠商瑞薩LFPAK產品,LFPAK封裝MOS管具有體積更小、效率高、性能更強等優點,其次LFPAK的散熱效率非常高(近于零的超低熱阻),還能從封裝的頂部分散熱量,為加裝散熱片輔助散熱奠定了基礎。
另外小編發現這款產品的PCB背面還疑似預留出了3顆去耦電容的位置,由此小編猜測七彩虹iGAME可能還將推出基于此PCB的更高端后續產品。
● 七彩虹公版GTX460 768MB
此外,七彩虹還有一款完全按照公版設計的GTX460 768MB顯卡,這里就不多做介紹了,其特點主要在附件部分,附送了非常實用的iGame工具包,包括瑞士軍刀、防靜電手套和束線帶,適合DIY玩家使用。
第四章/第五節 首批GTX460顯卡:影馳非公版1GB
影馳也第一時間推出了非公版設計的GTX460 1GB顯卡,不僅PCB經過了重新設計,連散熱器都是非常有個性的第二代可拆卸式風扇:
影馳GTX460 1GB版所使用的散熱器個性鮮明,與之前GTX470所用的散熱器風格比較相似,上一個版本最大的特色是風扇可以折疊起來,方便玩家清理灰塵,而新版本的風扇完全可以免螺絲手工拆下來。
散熱器整體結構與公版類似,但影馳的散熱片為平行風槽式,而公版為太陽花型,各有各的特色。平行風槽式可以形成一定的風道,有利于排出熱風。
供電部分的加強是影馳非公版設計的一大亮點,畢竟公版3+1相的設計有點寒酸,設計成4+1之后,非常有利于提高核心頻率。
核心與顯存和公版一樣,影馳這款非公版產品在散熱與超頻方面的表現值得期待,影馳顯卡專用的魔盤軟件還支持加壓超頻,相信可以完全釋放出GF104核心的潛能。
第四章/第六節 首批GTX460顯卡:翔升非公版1GB
翔升作為本土AIC,也第一時間推出了非公版GT460 1GB顯卡:
翔升這款GTX460 1GB版本的散熱器和PCB都是自主研發的。其散熱器造型雖然沒有影馳那么有個性,但散熱器結構基本相同,相信散熱能力和噪音方面的表現也不會差。
供電方面,也從公版的3+1相加強至4+1相,非公版設計都不約而同的照顧到了GF104的核心供電,方便玩家們超頻使用。翔升的供電接口為一個8Pin,它的供電能力就相當于兩個6Pin,更節約空間,但如果玩家的電源沒有8Pin口的話,還是需要使用兩個6Pin轉接成1個8Pin來使用。
核心顯存與公版相同
顯卡輸出接口部分比較特別,翔升把Mini HDMI接口居然換成了標準的大HDMI口。我們之前介紹過公版卡之所以設計小口是因為空間不足的關系,翔升設計的如此緊密,優勢是可以讓用戶無需轉接就能使用普通HDMI線纜,但這個HDMI空間過于狹小,有些線纜的接頭比較臃腫的話可能插不進去,這是一個很常見的BUG,購買HDMI線纜時需要注意。
第四章/第七節 首批GTX460顯卡:映眾微星旌宇768MB公版
首批GTX460顯卡中,很多AIC廠商都選擇了為1GB版本開發非公版PCB,清一色都是散熱與供電加強版,目的就是為了默認高頻與超頻。而對于768MB版本,則大多保持公版設計,這樣就能快速上市開賣。
首批送達泡泡網的GTX460顯卡
下面我們就來看看幾款AIC的GTX460 768MB顯卡,均為標準的公版設計,就不多做介紹了:
● 映眾GTX460 768MB
● 微星GTX460 768MB
● 旌宇GTX460 768MB
第五章 顯卡性能全方位測試
第五章/第一節 測試平臺與測試方法說明
★ 測試模式與測試方法:
此次發布的兩款顯卡定位中高端的游戲玩家,性能十分強勁,測試時所有游戲中盡可能開啟全部特效,包括內置的抗鋸齒(AA)和各向異性過濾(AF)。游戲最高提供8xAA就開8x進行測試,只有4x就開4x,沒有的話就不強制開啟。雖然有些游戲提供了更高精度的16xCSAA,但由于A卡不支持這種抗鋸齒模式,沒有可對比性,所以不做測試。
分辨率只測目前最主流的全高清1920x1200,更高的2560x1600由于30寸顯示器太昂貴,非普通玩家所能承受,因此不做測試。目前也有很多顯示器是1080p(1920x1080),游戲在這種分辨率下的性能表現與1920x1200差不多,FPS稍高一點點,使用這種顯示器的朋友依然可以參考我們的測試成績。
★ 測試平臺配置:
|
PCPOP.COM評測室 | |
|
硬件系統配置 | |
|
Intel Core i7 875 (2.93GHz L3=8MB 四核八線程) | |
|
主 板 |
MSI P55-GD65 |
|
顯 卡 |
GTX465 1GB (608/1215/3200MHz) GTX460 1GB (675/1350/3600MHz) GTX460 768MB (675/1350/3600MHz) HD5830 1GB (800/4000MHz) HD5770 1GB (850/4800MHz) GTX260 896MB (576/1242/2000MHz) |
|
內 存 |
CORSAIR 2GB x2 DDR3-1600(9-9-9-24-1T) |
|
硬 盤 |
日立1TB |
|
電 源 |
安耐美金魔族87+ |
|
軟件系統配置 | |
|
Windows 7 RTM 7600.16385 64Bit | |
|
DirectX |
11.0 |
|
顯示驅動 |
NVIDIA Forceware 258.80 WHQL ATI Catalyst 10.6 WHQL |
對于次高端的顯卡,這次測試并沒有使用最優異的平臺,而是選擇了中高端主流的Core i7 + P55平臺,性能并不輸給三通道X58平臺,價格便宜不少而且功耗發熱很低,搭配千元價位的顯卡非常合適。
顯卡方面,NVIDIA此次對于GTX460 1GB/768MB的定價很低,只賣1499/1299元,ATI同價位的顯卡只有HD5770,定位相近的顯卡有HD5830,這兩款顯卡將會是GTX460的主要對手。N卡方面,上月發布的GTX465將會加入對比,上代中高端主流GTX260+也會參與DX9C和DX10游戲項目的對比,因為GTX460的定位就是取代GTX260+。
所有參測顯卡都使用NVIDIA和AMD雙方的公版規格和公版頻率,這樣測得的性能和功耗發熱數據最有參考價值。
第五章/第二節 DX9C理論:《3DMark06》
軟件介紹:3DMark06作為DX9C權威的理論測試工具,包括了兩個SM2.0測試和兩個SM3.0測試場景,基本上達到了DX9C的畫面最高境界。雖然當今顯卡已全面進入了DX11時代,但考慮到至今仍有不少新游戲依然采用DX9C引擎,加入3DMark06的測試結果對于很多主流游戲都有參考價值的。
畫面設置:如今3DMark06已經難不倒高端顯卡了,高端顯卡在3DMark06中難分高下,所以我們只能最大程度的提高它對系統的要求,比如說提高分辨率開啟抗鋸齒等。所以我們選定了在1920x1200主流分辨率開啟4AA16AF以及最高的8AA16AF模式下,測試其總成績。

GTX465與兩款GTX460之間的性能差距非常小,都領先HD5830不少,這一結果令人非常欣慰。因為GTX460 768MB只要1299元,而HD5830最便宜的都要1799元,比GTX460 1GB都要貴。
接下來在熱門DX9C游戲中,我們看看性能表現是否與3DMark06一致?
第五章/第三節 DX9C游戲:《使命召喚6:現代戰爭2》
游戲介紹:作為《使命召喚》系列的第六部作品,在《現代戰爭2》中,將《使命召喚4:現代戰爭》劇情延續,俄羅斯又再次陷入政治上的紛擾不安。伏拉米爾.馬卡洛夫這位和伊姆蘭.扎哈恐怖組織有關連的粗暴領袖,策劃了一連串即將危及世界安全的陰謀。
相關評測:經典再度回歸!全特效爽玩[現代戰爭2]
畫面設置:《現代戰爭2》游戲中的畫質進階設定顯得比較簡單,在這里我們能看到常見的陰影開關、各種畫面細節、材質填充模式等。COD6雖然引擎比較老,但經過常年累月的優化,爆炸、煙霧、火焰效果都不輸給DX10游戲,要求也并不低。游戲內置AA最高4x,所以并沒有測試8xAA時的性能。
測試方法:游戲沒有提供Benchmark,測試時筆者選用了一段固定的場景,期間會有爆炸、大樓倒塌、灰塵彌漫等復雜的場景,通過Fraps記錄整個過程的平均FPS和最低FPS。
★ 1920x1200分辨率,抗鋸齒4x

看平均幀數的話,幾款顯卡的差別并不大,都運行的相當流暢,不過最小幀數才是決定游戲能否持續流暢運行的關鍵。因此此次測試我們不僅加入了最小幀,而且還將測試過程中的FPS波動曲線繪制出來,供大家參考:

可以看出,在測試前半分鐘,由于出現了復雜的爆炸場景和大量的煙霧效果,A卡的FPS損失比較嚴重,HD5830都下降至25幀以下。而幾款N卡都能保證30幀以上的流暢速度。
而在后半分鐘,場景比較穩定時,即便是最弱的HD5770發揮也很不錯。這說明ATI的GPU架構執行效能方面還是因場景而異,性能表現并不穩定。
第五章/第四節 DX9C游戲:《星際爭霸2:自由之翼》
相關評測:破解如此簡單!教你單機爽玩《星際2》
游戲介紹:萬眾期待的暴雪神作《星際爭霸》,在10年之后終于迎來的3D版本,目前暴雪已經正式開放了《星際爭霸2:自由之翼》的Beta測試。雖然該游戲并不支持時下流行的DX10、10.1甚至DX11,但暴雪憑借成熟的DX9C技術,也將畫面做的非常完美,大量HDR及SSAO特效的應用導致要求也比較高。
畫面設置:所有特效全開最高,分辨率使用常見的1920x1200。值得一提的是,星際2 Beta版目前還不支持抗鋸齒,如果驅動強開的話也沒有任何效果。因此測試時只使用內置的優異畫質模式。
測試方法:使用星際大腳破解星際2支持單機運行,和電腦對戰之后保存一局replay,然后播放錄像中一段激烈的戰斗場面,通過Fraps記錄平均FPS和最小FPS。
★ 1920x1200分辨率,Extreme畫質,沒有抗鋸齒

GTX260+果然是寶刀未老,在幾款經典DX9C游戲中的表現很不錯,都超越了HD5830。GTX460 768MB的性能也十分接近與HD5830,GTX460 1GB版本則有一定的優勢。

作為一款RTS游戲,會經常出現場景切換的動作,因此FPS波動也比較劇烈,雖然這些顯卡性能方面有不小的差異,但流暢運行《星際2》都沒有什么問題。
第五章/第五節 DX9C游戲:《優品飛車13:變速》
游戲介紹:作為優品飛車系列游戲的最新作品,《優品飛車:變速》早在發布之前就倍受媒體關注,而這其中不僅僅是IT、游戲媒體,專業的汽車媒體也對這款游戲給出了不少的報道。世界優異汽車廠商也紛紛對這款游戲的開發給了很大的贊助,游戲中隨處可見汽車廠商的廣告。據統計,《優品飛車:變速》這款游戲一共包含了72輛世界優異跑車,所涉及廠商也多達數十個,可見各大汽車廠商對這款游戲的關注。
畫面設置:優品飛車13依然沿用了前幾代的游戲引擎,還是DX9C并未進入DX10時代,但EA對畫面進行了精心優化,并信誓旦旦的稱優品13絕對是目前畫面最強的賽車游戲。此外優品13還采用了PhysX物理引擎,但只使用CPU進行演算,因此A卡不會有性能損失。由于游戲要求并不高,因此測試時所有特效全開最高并開啟8倍抗鋸齒。
測試方法:由于《優品飛車:變速》并沒有提供BenchMark程序,同時AI非常智能,這樣就會導致游戲每次在同樣的賽道上同樣的開車,都可能走出不同的路線或者其他效果,這給我們評測帶來了很大的麻煩。最后,我們只能找一段路況較好的車道,并在游戲開始前就統計幀數,直到一次撞墻結束后,再計算其平均幀數。
★ 1920x1200分辨率,抗鋸齒8x

在這款偏重于像素著色的老牌DX9C游戲中,擁有很多流處理器的A卡表現十分不錯,但依然被GTX460無情的擊敗了,原因出在哪呢?

原來HD5830和HD5770還是發布不太穩定,在視角或場景有切換動作時,FPS下降較多,導致成績落后一些。
第五章/第六節 DX9C游戲:《蝙蝠俠:阿卡姆瘋人院》
相關評測:黑暗使者![蝙蝠俠:阿卡姆瘋人院]試玩
游戲介紹:《蝙蝠俠:阿卡姆瘋人院》是根據Grant Morrison同名漫畫改編,堪稱蝙蝠俠歷代最黑暗的一作。瘋人院里關的都是蝙蝠俠親手逮捕的罪犯。瘋人院的一段歷史被揭開:原來其創辦者阿卡姆最后也淪為自己醫院里的精神病。這座哥特式的陰森建筑仿佛帶著數代的詛咒,成為蝙蝠俠和病人們無法擺脫的宿命。病人們滿足于自己的瘋狂,并不想逃離瘋人院;蝙蝠俠承認自己厭惡那里是因為去那里“就像回家一樣”。
畫面設置:《蝙蝠俠:阿卡姆瘋人院》使用的是大名鼎鼎的虛幻3引擎,PC版在畫面方面進一步提升,不僅解決了HDR+AA問題,還加入了新的光影特效,而且還完美支持NVIDIA的PhysX引擎及3D幻鏡技術。以高效率著稱的虛幻3引擎本身對顯卡要求不高,但大量PhysX效果的引入使得只有高端N卡才能跑動。
測試方法:游戲自帶Benchmark,拋開PhysX不談的話游戲的要求并不高,因此筆者直接開啟最高的8xMSAA進行測試。
★ 1920x1200分辨率,抗鋸齒8x


蝙蝠俠游戲內置了對N卡抗鋸齒的支持,效率比較高。而A卡必須在驅動控制面板強制開啟,因此性能損失非常大,即便不開PhysX,兩款A卡的性能也很差。
★ 1920x1200分辨率,抗鋸齒8x,PhysX High


開啟PhysX之后,不支持GPU加速的A卡瓶頸卡在CPU方面,始終都只有10幾幀,完全無法流暢運行。三款N卡的性能基本取決于浮點運算能力,與顯存的關系并不大。
第五章/第七節 DX10理論:《3DMark Vantage》
游戲介紹:3DMark Vantage所使用的全新引擎在DX10特效方面和《孤島危機》不相上下,但3DMark不是游戲,它不用考慮場景運行流暢度的問題,因此Vantage在特效的使用方面比Crysis更加大膽,“濫用”各種消耗資源的特效導致Vantage對顯卡的要求空前高漲,號稱“顯卡危機”的Crysis也不得不甘拜下風。
畫面設置:3DMark Vantage中直接內置了四種模式,分別為Extreme(旗艦級)、High(高端級)、Performance(性能級)和Entry(入門級),只有在這四種模式下才能跑出總分,如果自定義模式就只能得到子項目分數了。我們為這次的優異卡對決選擇了最高的Extreme模式,它其實就是最高畫質1920x1200分辨率再加上4AA16AF模式。
測試方法:N卡支持PhysX,在CPU測試子項中成績會翻幾倍,最終總成績會提高一些,但并不會影響GPU測試子項的成績,因此在測試中保持默認驅動設置,PhysX是開啟的。

GTX465、GTX460 768MB與HD5830的性能居然如此接近,看來在DX10游戲當中,幾款顯卡將會斗得難解難分。一款1299元的顯卡性能直逼1799元的顯卡,中高端顯卡市場顯然將面臨重新洗牌的局面。
第五章/第八節 DX10游戲:《孤島危機:彈頭》
游戲介紹:Crysis(孤島危機)無疑是DX11出現之前對電腦配置要求最高的PC游戲大作。Crysis的游戲畫面達到了當前PC系統所能承受的極限,超越了次世代平臺和之前所有的PC游戲。Crysis還有個資料片Warhead,使用了相同的引擎,只是多了一個關卡,因此我們還是使用原版做測試。
畫面設置:Crysis只有在最高的VeryHigh模式下才是DX10效果,但此前所有高端顯卡都只能在低分辨率下才敢開啟DX10模式,如今的DX11顯卡終于有能力單卡特效全開流暢運行。我們直上1920x1200高分辨率,開啟4AA和8xAA兩種模式進行測試。
測試方法:Crysis內置了CPU和GPU兩個測試程序,我們使用GPU測試程序,這個程序會自動切換地圖內的全島風景,得到穩定的平均FPS值。
★ 1920x1200分辨率,抗鋸齒4x

★ 1920x1200分辨率,抗鋸齒8x

N卡在開4x和8x時的平均FPS差別不大,只是最小FPS低了一點點。A卡略有損失,但也就是1幀左右。此消彼長之后,4x模式下A卡略占優勢,8x模式下N卡占優。但幾款顯卡跑起來還是非常吃力,顯卡危機果然名不虛傳!
由于Crysis自帶的Benchmark并沒有按時間軸進行測試,獲得的實時FPS波動曲線沒有可比性,因此這款游戲并沒有提供FPS曲線供大家參考。
第五章/第九節 DX10游戲:《沖突世界:蘇聯進攻》
游戲介紹:《沖突世界》將帶領玩家返回著名的冷戰時期,玩家每一個決定均影響游戲中人物和情節。可于游戲中感受不一樣的團隊精神,與隊友于陰森恐怖的戰場上一同作戰。《蘇聯進攻》是其最新的資料片,收錄全新角色、扮演蘇聯軍隊、10套新影片和全新多人聯機地圖等等。
畫面設置:《沖突世界》是首批DX10游戲之一,采用了自行研發的MassTech引擎,支持多種當前的主流顯示特效,如容積云,景深效果,軟陰影等,光照系統也表現出色,尤其是半透明的容積云特效營造出了十分逼真的戶外場景,物理加速結合體積光照渲染出了最逼真的爆炸效果。
測試方法:內置Benchmark是一段非常華麗的過場動畫作為測試程序,最終得出最大、最小和平均FPS,測試結果非常精確。WIC最高支持4AA,因此我們只測試1920 4AA16AF模式。
★ 1920x1200分辨率,抗鋸齒4x,各項異性過濾16x

GTX460 768MB的性能都非常出色,這讓自家的GTX465和競爭對手的HD5830情何以堪?

通過實時FPS波動曲線可以看出,兩款A卡在前期非常激烈的戰斗和爆炸場景,FPS下降非常嚴重,這就直接導致了它們的整體性能不如N卡。而在后半部分比較穩定的場景,HD5830的性能甚至比GTX460 1GB還要略勝一籌。
第五章/第十節 DX10.1游戲:《孤島驚魂2》
游戲介紹:自《孤島驚魂》系列的版權被UBI購買之后,該公司蒙特利爾分部就已經開始著手開發新作,本作不但開發工作從Crytek轉交給UBI,而且游戲的故事背景也與前作毫無關系,游戲的圖形和物理引擎由UBI方面完全重新制作。
畫面設置:借助于蒙特利爾工作室開發的全新引擎,游戲中將表現出即時的天氣與空氣效果,所有物體也都因為全新的物理引擎,而顯得更加真實。你甚至可以在游戲中看到一處火焰逐漸蔓延,從而將整個草場燒光!而且首次對DX10.1提供支持,雖然我們很難看到。
測試方法:游戲自帶Benchmark工具。
★ 分辨率1920x1200,抗鋸齒4x


★ 分辨率1920x1200,抗鋸齒8x


FarCry2中幾款顯卡的性能表現與Crysis截然不同,兩款A卡大幅落后于三款N卡,甚至還不如上代的GTX260+。
第五章/第十一節 DX10.1游戲:《鷹擊長空》
游戲介紹:《鷹擊長空》由Ubisoft旗下的Bucharest Studio工作室所研發制作而成,以湯姆克蘭西最擅長的近現代國際沖突為背景,加上現代化的軍事武器,和五角大廈不愿證實的開發中的先進武器,交織出最激烈的高科技攻防戰。而《鷹擊長空》也脫離前面幾項作品的框架,將戰爭從地面拉拔到空中,享受廣大無界限的戰斗空間。
畫面設置:《鷹擊長空》直接內置了對DX10和DX10.1的支持,它會自動檢測顯卡最高能支持的級別。通過此前的測試來看DX10.1并不會讓畫質變得更高,但的確能夠讓游戲跑得更快。我們使用1920分辨率,4AA和8AA兩種模式進行測試。
測試方法:游戲自帶Benchmark,AN雙方都開啟DX10.1模式。
★ 分辨率1920x1200,抗鋸齒4x

★ 分辨率1920x1200,抗鋸齒8x


A卡再次落后于N卡,不過落后幅度沒有FarCry2那么夸張,幾款顯卡的FPS波動曲線都比較穩定,證明已經發揮出了全部實力。
第五章/第十二節 DX11理論測試:《Heaven Benchmark 2.0》
游戲介紹:Unigine Engine率先發布了首款DX11測試/演示程序——Heaven Benchmark,其中大量運用了DX11新增的技術和指令,看來在新版3DMark面世之前,Heaven將會是DX11性能測試的非常好的選擇。
畫面設置:2.0版本進一步強化了Tessellation技術的應用,細分精度更高,畫面更上一層樓,測試時所有特效全開最高,包括Extreme級別的Tessellation。
測試方法:自帶Benchmark,由于該Benchmark測試條件非常嚴酷,開啟8xAA后幾款顯卡都性能暴跌沒有可觀賞性,因此只測試4AA16AF模式下的性能。
★ 分辨率1920x1200,抗鋸齒4x,各項異性過濾16x


Heaven 2.0的測試過程比較漫長,總共有多達26個場景(視角),因此實時FPS波動曲線比較密集。最終性能差異也很明顯,Tessellation性能偏弱的HD5830沒能討得任何好處。
第五章/第十三節 DX11游戲:《BattleForge》
游戲介紹:《BattleForge》是EA旗下德國Phenomic游戲制作室研發的全新即時戰略網絡游戲。在《BattleForge》中,玩家依靠收集、交易卡牌來建立龐大的軍隊。通過在線贏取、交易和購買卡牌來組成你強大的陣容,混合搭配不同屬性的卡牌來和朋友進行在線戰斗,或是在大規模的在線戰役中取得勝利。
畫面設置:從技術角度來講,這款游戲也非常值得關注,其畫面堪稱網游頂尖之作,率先提供了對DX10.1技術和屏幕空間環境光遮蔽(SSAO)特效的支持,還針對多核心處理器進行了優化。現在又第一時間對DX11加入了支持,加入了HDAO和DirectCompute,測試時自然所有特效全開最高。
測試方法:《BattleForge》雖然是款網游,但游戲自帶了Benchmark,這給評測帶來了很多便利。Benchmark可以測出最大/最小/平均FPS三個數值,筆者連跑三遍Benchmark得到最穩定的成績,保留了最有參考價值和的平均FPS和最小FPS供大家參考。
★ 分辨率1920x1200,抗鋸齒4x,各項異性過濾16x


★ 分辨率1920x1200,抗鋸齒8x,各項異性過濾16x


《BattleForge》本身是一款DX10.1游戲,在HD5870發布當天停機維護一小時后正式加入了DX11模式。雖然這款RTS網游并沒有在國內開服運營,中國玩家對其知之甚少,但能夠如此神速的對DX11提供支持,而且新增的DX11模式對游戲性能影響非常顯著,可以說是檢驗DX11顯卡實力的必測游戲。
遺憾的是,作為專為HD5000系列而生的首款DX11游戲,A卡的表現并不出色,平均FPS輸給GTX460也就罷了,最關鍵的是最小FPS差距太大,在激烈的戰斗場面出現卡機意味著什么相信大家都明白。
第五章/第十四節 DX11游戲:《科林麥克雷:塵埃2》
游戲介紹:《科林麥克雷》系列游戲是為紀念去世的英國拉力賽車手科林·麥克雷(Colin McRae)而制作的,因此在游戲過程中不難見到許多麥克雷過往的身影。與一年一款的優品系列賽車游戲不同,DiRT2距離前作已經兩年之久,目前《科林麥克雷:塵埃2》主機版早已上市,幾乎登陸所有的主機和掌機平臺、好評如潮,而PC版由于支持DX11的緣故,所以被延期數月。
畫面設置:DIRT2堪稱DX11游戲代表作,DX11的五大關鍵特性在這款游戲中都有體現,但卻沒有得到大范圍的應用,都是點到為止。比如Tessellation主要體現在水洼和旗幟上,而賽車過程中也就那么幾處采用了該技術,因此這款DX11的要求并不高,特效全開的話中端顯卡都能跑動。
測試方法:游戲自帶Benchmark程序,會自動跑完一個固定的賽道,非常接近于真正玩游戲的模式,最后得出平均FPS和最小FPS。
★ 1920x1200分辨率,抗鋸齒4x


★ 1920x1200分辨率,抗鋸齒8x


《塵埃2》作為AMD官方贊助并力挺的DX11游戲大作,居然和《BattleForge》一樣沒有任何機會,完敗!好在《塵埃2》是目前要求最低的DX11游戲,即便是HD5770在1920x1200 8xAA模式下都能有30幀以上的成績,足夠流暢運行了。
第五章/第十五節 DX11游戲:《潛行者:普里皮亞季的召喚》
游戲介紹:《潛行者》系列游戲現在已經出到第三部了,其中第二部《晴空》是原作《陰影》的前傳,而第三部《普里皮亞季的呼喚》則是原作《陰影》的后傳,講述了在變異區中心被發現后,烏克蘭政府決定舉行代號“航道”的大規模軍事行動,目的則是控制變異區的科技,玩家的冒險也就此展開。
畫面設置:此前《潛行者:晴空》已經率先支持DX10.1,主要優化了抗鋸齒算法、陰影渲染和效率,新版的資料片則首次加入支持DX11,通過Tessellation技術大幅加強了模型細節、紋理和光影,而且通過DirectCompute 11技術改進了算法,提升游戲性能。測試時將包括透明抗鋸齒在內的所有特效全開最高,考驗高端顯卡在最高畫質下的性能表現。
測試方法:使用官方Benchmark包進行測試,游戲沒有提供更高的AA級別,因此只測試4AA模式。
★ 分辨率1920x1200,不開抗鋸齒

★ 分辨率1920x1200,抗鋸齒4x

不開抗鋸齒的話,GTX465、GTX460和HD5830的性能差別不是很大。可打開抗鋸齒之后,GTX460 1GB的性能損失比較小,其它幾款顯卡都下降很厲害。
第五章/第十六節 DX11游戲:《異型大戰鐵血戰士》
相關評測:年度DX11大作!異形大戰鐵血戰士測試
游戲介紹:《Aliens vs. Predator》同時登陸PC、X360和PS3,其中PC版因為支持DX11里的細分曲面(Tessellation)、高清環境光遮蔽(HDAO)、計算著色器后期處理、真實陰影等技術而備受關注,是AMD大力推行的游戲之一,但是這樣的主題難免讓本作有很多不和諧的地方,暴力血腥場面必然不會少!發行商世嘉在2009年11月就曾明志,表示不會為了通過審查而放棄電子娛樂產品發行商的責任,因為游戲要維持“異形大戰鐵血戰士”這一中心主題,無論畫面、玩法還是故事線都不能偏離。
畫面設置:AVP原始版本并不支持AA,但升級至1.1版本之后,MSAA選項出現在了DX11增強特效當中,當然還支持Tessellation、HDAO、DirectCompute等招牌。該游戲要求不算太高,所以筆者直接將特效調至最高進行測試。
測試方法:游戲自帶Benchmark
★ 1920x1200分辨率,不開抗鋸齒


★ 1920x1200分辨率,抗鋸齒4x


這又是一款AMD力推的DX11游戲大作,我們可以看到在不開抗鋸齒的模式下,HD5830的表現非常出色,以微小的優勢力壓三款N卡。
但打開抗鋸齒之后,局面發生了逆轉,HD5830的性能還不如GTX460 768MB,新一代GTX400系列N卡在抗鋸齒效能方面果然有了質的提高,抗鋸齒效能比HD5000系列還要強大,而且還能支持精度更高的32xCSAA技術。
第五章/第十七節 DX11游戲:《戰地:叛逆聯隊2》
游戲介紹:《戰地:叛逆連隊2》(Battlefield: Bad Company 2),是EA DICE開發的一款第一人稱射擊游戲。開發商EA已經于本月2日正式同步發售了Xbox 360、PS3、PC版。該游戲是EA DICE開發的第9款“戰地”系列作品,也是《戰地:叛逆連隊》的直接續作,在繼承前作特性的基礎上,強化了多人聯機載具對戰和團隊合作元素的設定。游戲使用加強版的寒霜引擎,加入了建筑物框架破壞和物體分塊破壞的支持。
畫面設置:《叛逆聯隊2》雖然是款DX11游戲,霜寒引擎也是備受期待的DX11引擎,曾被ATI用來做Tessellation的技術展示。不過最新版本的對DX11的支持非常有限,僅僅是采用新指令集渲染HBAO特效而已,游戲會自動偵測顯卡的DX級別來選擇渲染模式。
測試方法:游戲不帶Benchmark,筆者選取了單人任務模式下的一段無需手動干涉的過場動畫進行測試,其中包括大量激烈的轟炸爆破激戰場面,完全可以反映真實的游戲性能。
★ 1920x1200分辨率,抗鋸齒4x,各項異性過濾16x


★ 1920x1200分辨率,抗鋸齒4x,各項異性過濾16x


4xAA和8xAA,N卡的性能幾乎沒有下降,A卡有一定程度的下降。從FPS波動曲線來看,遇到戰斗激烈的場景時,A卡性能下降幅度更加夸張一些,這也就是最終N卡性能占優的主要原因。
看來還是N卡的發揮更穩定一些,能夠為玩家帶來更流暢的游戲感受,而不僅僅是跑出來的成績好看。
第五章/第十八節 DX11游戲:《地鐵2033》
游戲介紹:《地鐵2033》(Metro 2033)是俄羅斯工作室4A Games開發的一款新作,也是DX11游戲的新成員。該游戲的核心引擎是號稱自主全新研發的4A Engine,支持當今幾乎所有畫質技術,比如高分辨率紋理、GPU PhysX物理加速、硬件曲面細分、形態學抗鋸齒(MLAA)、并行計算景深、屏幕環境光遮蔽(SSAO)、次表面散射、視差貼圖、物體動態模糊等等。
畫面設置:《地鐵2033》雖然支持PhysX,但對CPU軟件加速支持的也很好,因此使用A卡玩游戲時并不會因PhysX效果而拖累性能。該游戲由于加入了太多的尖端技術導致要求非常BT。
測試方法:游戲不帶Benchmark,筆者選取了單人任務模式下的一段片頭動畫進行測試,這段畫面雖然不是戰斗場景并不激烈,但已經讓高端顯卡不堪重負了。
★ 1920x1200分辨率,不開抗鋸齒,各項異性過濾16x


★ 1920x1200分辨率,抗鋸齒4x,各項異性過濾16x


當今最強的GTX480和HD5970在特效全開的情況下運行地鐵2033都比較勉強,那么次一級的GTX460和HD5830自然是無法流暢運行的。所以這里的測試成績只能反映其性能水平,對于實際玩游戲卻沒有代表價值。
第五章/第十九節 DX11演示Demo:《石巨人》
游戲介紹:游戲引擎開發商BitSquid與游戲開發商Fatshark近日聯合公布了一個展示DX11強大技術的DEMO。這個名為《StoneGiant》(石巨人)的DEMO,可以讓玩家來測試自己PC顯卡的DX11性能。BitSquid Tech即將提供PC平臺的引擎,并且大概在今年第三季度將提供PS3和Xbox 360等其他平臺的引擎。
畫面設置:StoneGiant是一款技術演示Demo,畫面做的非常精美,進入之后可以選擇開啟關閉Tessellation以及DOF(DX11級別景深)進行測試,這兩項技術都十分消耗資源,尤其是同時打開時。其中Tessellation技術對畫質的改善最為明顯,而DOF如果不細看則不容易察覺,因此測試時默認開啟Tessellation、分別打開和關閉DOF進行兩次測試。
測試方法:游戲自帶Benchmark。
★ 1920x1200分辨率,不開景深


★ 1920x1200分辨率,開啟景深


看得出來,A卡的“壓力”確實很大,DX11特效使用的越多,其表現就越差,這就是架構問題,因為HD5000依然沿用了第一代DX10顯卡HD2000的架構,已經滿足不了純DX11游戲的需要了。而GTX465和GTX460則使用了專為DX11設計的全新架構,面對嚴酷的DX11渲染依然能夠得心應手。
第六章 附加測試項目與成績匯總
光看冗長的游戲性能測試可能還不夠,很多玩家更關心的是新顯卡的功耗、發熱、噪音,甚至還有通用計算性能。對于這款NVIDIA最新的顯卡,筆者也很想知道它在這些方面的表現到底如何,我們一起來看看吧:
第六章/第一節 附加測試:顯卡功耗
我們的功耗測試方法是直接統計整套平臺的總功耗,既簡單、又直觀。測試儀器為微型電力監測儀,它通過實時監控輸入電源的電壓和電流計算出當前的功率,這樣得到的數值就是包括CPU、主板、內存、硬盤、顯卡、電源以及線路損耗在內的主機總功率(不包括顯示器)。
待機為windows7桌面下獲得的最小值;滿載是以1920 8AA模式運行Furmark時的最大值,Furmark能夠讓顯卡穩定的以100%滿負載模式運行,測得的功耗值比一般的游戲要高一些。

測試結果令人相當滿意,兩款GTX460的待機功耗非常低,甚至比HD5770還要低,看來NVIDIA的節能設計已經達到了爐火純青的地步,完美的解決了待機功耗過大的問題。要知道多數游戲玩家并不是時時刻刻都在玩游戲,顯卡在待機時如果消耗太多電力的話,是得不償失的。
不過在滿載模式下,GTX460要比HD5830高22W-28W,這個結果完全可以接受,因為其性能也要比HD5830強不少。GTX460要比自家上代的GTX260和性能相近的GTX465低50-60W,玩家們再也不用擔心會浪費電了。
根據NVIDIA官方公布的數據,GTX460的待機功耗略低于HD5830,TDP也要小于HD5830,但實際測出來的結果是滿載功耗要高于HD5830,而且不僅是在Furmark拷機測試中,絕大多數游戲中GTX460的功耗也是要高于HD5830的。
第六章/第二節 附加測試:顯卡發熱
GTX460的功耗相當不錯,那么發熱和噪音方面如何呢?我們借助一些監控工具來看看。測試環境為開放式平臺,中央空調保證室溫穩定在25度左右:
GTX460拷機測試截圖:最高僅66度
藍寶石HD5830拷機測試截圖:最高68度
公版GTX465拷機測試截圖:最高達90度!
藍寶石HD5830的散熱器風扇口徑較大,散熱器體積也比較大,溫度控制也非常出色。而公版的GTX465由于核心本身發熱恐怖,加之公版散熱器效能一般,最終溫度達90度,非常恐怖。
通過GPU-Z截圖來看,待機時GTX460核心/流處理器/顯存頻率只有50.6/101/67.5MHz,低得難以想象,電壓也降至0.875V,難怪待機功耗和溫度都如此之低。
而在滿載時,頻率和電壓均恢復正常,此時公版風扇的轉速也只有46%,噪音非常小,不貼近風扇幾乎聽不到。
根據NVIDIA官方公布的數據,GTX460公版散熱器的噪音表現要低于藍寶石HD5830,筆者的實際感受也確實如此,藍寶HD5830由于風扇口徑較大,滿載時噪音略高些,但也算比較安靜的。
第六章/第三節 CUDA性能測試:蛋白質折疊分布式計算
Folding @home是一個由斯坦福大學主持,全球主要硬件廠商共同參與的大規模公益性分布式運算項目。其主要是研究了解蛋白質折疊、誤折以及相關的疾病,主要研究的疾病包括:癌癥、阿茲海默癥、亨廷頓病、帕金森氏癥等。我想,這是一個比單純跑各種Benchmark來得更有價值的事情。
在GTX480發布沒多久之后,斯坦福官網上就已經提供了支持GTX400系列顯卡的GPU3客戶端,但目前官網上的客戶端都不能支持HD5000顯卡,看來AMD已經不太重視這類公益性的GPU通用計算應用了。
所以,本項測試只能在N卡內部進行對比:
開啟Folding @ Home GPU3客戶端后,GTX460可以99%滿負載運行

經過實際測試來看,GTX460的PPD(日貢獻分值)可達上代中端熱門產品GTX260+的將近兩倍,而其功耗卻要比GTX260+低50瓦以上!
看來GTX460將會是一款完美的蛋白質跑分利器,如果能將GTX460設計成單槽散熱(GTX260+都可以單槽,功耗發熱更低的GTX460必然可以),在一塊主板上插7片的話,那么個人超級計算機的運算能力將會有一個質的提升!
第六章/第四節 CUDA性能測試:Badaboom視頻轉碼
N卡和A卡在游戲性能和相關功能方面可能是各有所長、互有勝負,誰都沒有絕對的領先優勢。但在GPU通用計算方面,差距可就不是一點半點了,CUDA應用軟件不但在數量上占據壓倒性優勢,而在質量與性能方面也比Stream強大許多。
所以,在進行了大量的游戲性能測試之后,筆者開始針對CUDA通用計算進行專項測試。這里選用了CUDA的成名代表作——Badaboom視頻轉碼軟件。
測試方法:使用Badaboom將一段1080p TS格式預告片轉成720p MP4格式的文件,碼率及相關設置采用了Badaboom內置的方案不做更改。再將一端DVD花絮轉換成iPhone支持的格式,更換不同顯卡檢驗性能差距。
在視頻轉碼過程中我們發現,Badaboom能夠充分利用GTX460的流處理器資源,視頻引擎負載和GPU負載都達到90%以上,轉碼速度遠快于四核甚至六核純CPU運算。


與游戲中GTX460 1GB力壓GTX465的情況不同,在蛋白質和視頻轉碼這類CUDA應用中,GTX465的表現反而更好一些,而GTX460 768MB的性能并不比1GB弱多少。看來民用級CUDA應用對顯存的要求不高,價格低廉的GTX460 768MB更值得選用。
第六章/第五節 超頻性能測試:GTX460大戰HD5850
默認頻率下的GTX460就能夠大幅領先于HD5830,性能十分接近于HD5850,那么超頻后的GTX460實力顯然會更強。

默認頻率高達850/1700/4000MHz的GTX460
在我們收到的送測樣品當中,七彩虹非公版GTX460 1GB的默認頻率高達850/1700/4000MHz,通過實測發現這個頻率的GTX460性能已經完全超越了HD5850,一款1499元的中端顯卡輕松干掉了2299元的高端顯卡……

而且,七彩虹這款GTX460在不加電壓的情況下,還有繼續超頻的潛力,核心并沒有超太多,而顯存達到了4400MHz,性能又有所提升:

可以看到,經過超頻之后,GTX460在絕大多數游戲中的性能都超越了AMD高端主力HD5850,性能相比公版提升幅度可達20%-30%之多。根據我們的測試來看,不光是非公版產品好超,其實公版GTX460也都能穩超800MHz以上,至少提升20%。
第六章/第六節 成績匯總與PK:GTX460 1GB比GTX460 768MB強多少

如果GTX460 768MB只是顯存容量比GTX460 1GB少了256MB的話,那么兩款顯卡的性能差距就不會有這么多了,因為大多數游戲在1920分辨率下耗費不了太多顯存。但由于GTX460 768MB的顯存帶寬、光柵單元和二級緩存都有所損失,最終性能落后了大概10%。
考慮到GTX460 768MB的售價要比GTX460 1GB便宜200元,顯然GTX460 768MB的性價比要更高一些。
第六章/第七節 成績匯總與PK:GTX460 1GB比GTX465 1GB強多少

通過前面的理論分析可以知道,GTX460憑借較高的默認頻率,浮點運算能力要高于GTX460,顯存帶寬也更大一些。因此GTX460 1GB性能超越GTX465不足為奇。但由于GTX465基于GF100核心,擁有更多的光柵引擎和多形體引擎,因此GTX460在DX11游戲中領先GTX465的幅度就沒有那么多了。
GTX460 1GB賣1499元,GTX465 1GB賣1899元,前者的功耗發熱比后者低那么多,看來GTX465如果沒有明顯的價格優勢的話,很難賣出去了。
第六章/第八節 成績匯總與PK:GTX460 1GB PK HD5830 1GB

除了《孤島危機》4AA、《異型大戰鐵血戰士》noAA這兩種模式下,GTX460 1GB小負HD5830外,其他所有游戲中都是全勝,而且領先優勢還都非常明顯。
A卡,不降價不行了……
第六章/第九節 成績匯總與PK:GTX460 1GB PK HD5830 1GB

GTX460 768MB與HD5830之間的對決就有點意思了,互有勝負,都是贏也贏不了太多、輸也就輸那么一點。整體來看,即便拋開純演示和Benchmark之后還是GTX460 768MB更占優勢一些。
看來,A卡不僅要降價,而且必須大跳水才成……
● 性能總結:
GTX460 1GB以壓倒性的優勢完勝HD5830,GTX460 768MB的表現也可圈可點,整體性能領先于HD5830。AMD看似密不透風的DX11顯卡產品線終于被NVIDIA擊潰,這兩款GTX460打倒了HD5830之后,還排擠了HD5770的生存空間,使得AMD兩款炙手可熱的明星產品風光不再。
而且GTX460的實力并不僅限于此,該產品默認頻率較低,NVIDIA給AIC合作伙伴和用戶們留下了十分可觀的超頻空間,AIC們已經迫不及待的拿出了非公版超頻版產品,其性能足以挑戰AMD更高端的HD5850。如此一來,AMD遭受打擊的產品將不止是HD5830這一款,2000多元的HD5850和1000元左右的HD5770都處境尷尬。
GTX460的確是NVIDIA為游戲玩家設計的一款接近完美產品,其性能足以在全高清分辨率下流暢運行當今幾乎所有的主流游戲,包括大多數DX11游戲;專為DX11優化設計的強大曲面細分和幾何性能,也足以應付日后即將發布的DX11游戲;優秀的功耗控制也不會讓游戲玩家在空閑時浪費太多的電能,較低發熱和噪音可以輕松度過炎炎夏日;最重要的是厚道的價格讓玩家們可以無需等待就能出手享用。
● 技術分析:
此前GTX480/470的性能其實都相當不錯,但是較高的功耗和發熱給人們留下了不好的印象。其主要問題是GF100核心太過龐大,40nm工藝不夠成熟導致功耗和良品率都不甚理想。如今中等規模的GF104核心橫空出世,GTX460的優異表現證明了NVIDIA新一代Fermi架構的成功。
當然,別忘了GTX460所使用的GF104核心并非是完整規格,GF104一旦開啟全部384個CUDA核心之后,恐怕AMD單芯旗艦HD5870也將在劫難逃。
但NVIDIA也不能得意忘形了,畢竟GF104(19.5億)與Cypress(21.5億)的晶體管數是相當的,它們本應該是同一級別的產品,只不過此前AMD沒有對手敢賣高價,而NVIDIA定價更厚道一些終結了AMD的暴利時代。可以想象接下來要發生的肯定會是一場慘烈的成本戰和價格戰。
● 市場展望:
AMD方面似乎已經意識到了GTX460的強大實力,就在昨天某AIB品牌宣布將HD5830直降300元,達到了1499元的歷史新低,堅挺的HD5000終于扛不住了。但通過我們今天的性能測試來看,HD5830完全不是GTX460 1GB的對手,即便降至1499元還是性價比不高,看來AMD必須在市場上有進一步的行動,才能阻擋NVIDIA新品的猛烈攻勢。
我們不止一次的強調過,有競爭才會有高速的發展,才能給消費者帶來更強、更實惠的產品。此次NVIDIA發布的兩款GTX460售價如此厚道,性能如此強勁,不僅讓NFan們揚眉吐氣,而且迫使A卡降價,讓AFan們可以花更少的錢買到更好的顯卡。
當然GTX460的發布也給NVIDIA產品線造成了深遠的影響,好消息是NVIDIA終于在千元價位拿出了像樣的產品,迅速填補的GTX260+退市后的空白;而壞消息就是GTX460性能實在太強,幾乎沒有給GTX465留下什么生存空間,手頭積壓了不少GTX465存貨的AIC們該怎么辦?■<
關注我們


