橫掃一切3D游戲!GTX TITAN 三卡測試
泡泡網顯卡頻道3月25日 集成71億晶體管的GK110以其無以倫比的性能證明了它是地球最快的GPU,但沒有最快只有更快,如果想要繼續提升性能超越極限,NVIDIA的SLI技術行之有效。
SLI的全稱是Scalable Link Interface(可升級連接接口)也稱速力,是NVIDIA的專利技術。它是通過一種特殊的接口連接方式,在一塊支持雙PCI Express X 16的主板上,同時使用兩塊或者以上數量的同型號PCIE顯卡。
多顯卡并行機制的歷史最早可以追溯到1998年初,3Dfx推出了它們的第二代3D圖形卡產品—Voodoo 2,當時Voodoo 2擁有90Mps的像素填充率,具備Z-Buffering、Anti-Aliasing、單周期雙紋理等當時非常先進的3D特性,大幅超越其上一代產品,不過,最令發燒友瘋狂的是Voodoo 2所具有的“SLI交錯互連技術”,這項技術可以讓兩塊Voodoo 2顯卡連接起來并行運作,獲得近乎翻倍的3D效能。如此一來,其他競爭者更是望塵莫及。
究其原理,顯卡最終生成的是所渲染的3D畫面,畫面的生成速度即代表著顯卡的性能,SLI技術將一幅渲染的畫面分為一張張的掃描幀(Scanline),若采用雙顯卡運行模式,那么就由一個顯卡負責渲染畫面的奇數幀,另一塊顯卡渲染偶數幀,然后將同時渲染完畢的幀線進行合并后寫入到幀緩沖中,接下來顯示器就可以顯示出一個完整的渲染畫面。不難看出,雙卡SLI技術讓渲染工作被平均分擔,每塊顯卡只需要完成1/2的工作量。
理想狀態下,有幾塊顯卡并行計算,渲染效率就有可能達到單卡的幾倍,所以如果想要追求極限的性能,SLI技術無疑是非常好的選擇,多顯卡并行平臺也是顯卡發燒友的終極裝備,所以我們特意召集了三塊GTX TITAN進行專門的SLI測試,看看當今最強悍的GPU多卡SLI效率如何,同時通過測試向大家展示一下當今最強游戲平臺的性能究竟變態到什么程度!
隨著科學、醫學、工程和金融各領域對高性能并行計算需求的增加,NVIDIA以無比強大的GPU計算架構來不斷創新和滿足這種需求。NVIDIA現有的 Fermi GPU已經重新定義和加速了以下領域的高性能計算(HPC)的功能,如地震處理、生化模擬、天氣和氣候建模、信號處理、計算金融、計算機輔助工程、計算流體力學和數據分析。NVIDIA的新Kepler GK110 GPU大大提高了并行計算標準,并將會幫助解決世界上面臨的最困難的計算問題。

通過提供比上一代GPU更強大的處理功能以及優化和提高GPU上并行執行工作負載的新方法,Kepler GK110簡化了并行程序的創建,將對會對高性能計算引起進一步改革。
Kepler GK110由71億個晶體管組成,是有史以來架構最復雜的微處理器。GK110新加了許多注重計算性能創新功能,目的是要成為NVIDIA Tesla和HPC市場上的并行處理動力站。
Kepler GK110會提供超過每秒1萬億次雙精度浮點計算的吞吐量,DGEMM效率大于80%,而之前的Fermi架構的效率是60‐65%。
除了性能之外,Kepler架構在電源效率方面也有巨大的飛躍,相對于Fermi 的性能/功率比提高了3倍之多!
Kepler GK110 模具照片
之前有人說Kepler GK110更適合超級計算和通用計算,其實這是一種誤解。Kepler GK110的以下新功能不僅提高GPU的利用率,簡化了并行程序設計,而且有助于GPU在各種計算環境中部署,無論是從個人電腦還是超級計算機,GK110都適用:
Dynamic Parallelism – 能夠讓 GPU 在無需 CPU 介入的情況下,通過專用加速硬件路徑為自己創造新的工作,對結果同步,并控制這項工作的調度。這種靈活性是為了適應程序執行過程中并行的數量和形式,編程人員可以處理更多的各種并行工作,更有效的將 GPU 用為計算用途。
Hyper-Q – 允許多個CPU核同時在單一GPU上啟動工作,從而大大提高了GPU 的利用率并削減了CPU空閑時間。Hyper‐Q 增加了主機和 Kepler GK110 GPU 之間的連接總數(工作隊列),允許 32 個并發、硬件管理的連接(與 Fermi相比,Fermi 只允許單個連接)。
Grid Management Unit –使 Dynamic Parallelism 能夠使用先進、靈活的 GRID 管理和調度控制系統。新 GK110 Grid Management Unit (GMU) 管理并按優先順序在 GPU上執行的 Grid。GMU 可以暫停新 GRID 和等待隊列的調度,并能中止 GRID,直到其能夠執行時為止,這為 Dynamic Parallelism 這樣的強大運行提供了靈活性。
NVIDIA GPUDirect–NVIDIA GPUDirect 能夠使單個計算機內的 GPU 或位于網絡內不同服務器內的 GPU 直接交換數據,無需進入CPU系統內存。GPUDirect 中的 RDMA 功能允許第三方設備,例如 SSD、NIC、和 IB 適配器,直接訪問相同系統內多個 GPU 上的內存,大大降低 MPI從GPU內存發送/接收信息的延遲。還降低了系統內存帶寬的要求并釋放其他 CUDA 任務使用的 GPU DMA 引擎。
這里先做簡單介紹,詳細的內容擴展之前的首發文章已經有詳細的說明,這里就不再贅述了。
第一眼看到GTX TITAN還以為是GTX 690呢。仔細端詳,發現還有略有不同,擋板接口旁邊的“TITAN”字樣暴露了它的身份。
其實這也在情理之中,GTX 690別具匠心的設計深受好評,如果僅僅在一款雙芯火星卡上曇花一現未免太過可惜。
改良版的渦輪離心式風扇看起來非常美觀。拆下外殼以后的風扇全貌。
散熱器頗有份量,工藝也非常不錯。至少擰了一二十個螺絲才將其拆下。均熱板底座比普通純銅底座散熱效率更高。
組裝起來渾然一體,拆開以后卻發現零件眾多,和一般顯卡相比,TITAN的散熱器構造比較復雜。
這是TITAN的散熱器的核心部件,底座鰭片一體式的鍍鉻散熱模塊。
TITAN的PCB結構緊湊,用料扎實但并沒有華碩的戰神、微星的閃電那么張揚。
其實對于多數人來,GK110雖然從未正式亮相消費級市場,但并不陌生,NVIDIA之前為高性能服務器設計的優異產品Tesla K20X采用的就是這款芯片。
別看它其貌不揚,它可是集成了71億晶體管、擁有6個核心,2688個流處理器的真正怪獸。一秒的瞬間就能爆發出超過4500flops的處理能力!看過正在熱映的西游降魔篇嗎?看似小猴子,一秒變金剛!
TITAN的核心和Tesla K20X唯一的不同就是,TITAN的頻率更高!Tesla K20X核心默認頻率為732MHz,而TITAN達到了837MHz。性能攀升,功耗也隨之水漲船高,TITAN的TDP達到了250W,比Tesla高出15W。8加6Pin接口,5加1相供電保證了GPU核心和顯存的需要。
顯存芯片為三星出品的K4G20325F0-FC03,0.3ns三星的顯存顆粒是業界公認的優異顯存,超頻潛力很大。正反24個顆粒組成了384bit、6GB容量的顯存規格,單芯顯卡顯存容量如此之大前所未有!顯然一般平臺的1080P顯示器已經不是TITAN所要挑戰的對象,未來的4K以上分辨率才是其真正對手。
TITAN做工一絲不茍,該屏蔽的地方絕不含糊。筆者感覺比之前的公版做工都要更好一些。當然這些都是它應該具備的東西:聽說這款性能強大的顯卡售價也是奇高。
TITAN背面
安森美新推出的NCP4206六相PWM控制芯片,由于主控不帶驅動IC,所以PCB上6顆標著AZN的東西就是小型驅動IC。
考慮到它的定位,TITAN的長度并不夸張,一般的機箱即可容納
NV高端顯卡經典的接口組合:DP HDMI 雙DVI的陣型無論是對付多個顯示設備還是多種顯示設備均毫無壓力。
GTX TITAN凈重935克。
此次測試的顯卡可謂毋庸置疑的旗艦,測試時所有游戲中開啟全部特效,包括4X抗鋸齒(AA)和16X各向異性過濾(AF)。雖然很多游戲提供了更高精度的AA,但由于實用價值不高,且沒有可對比性,所以不做測試。

目前也有部分顯示器是(1920x1200),游戲在這種分辨率下的性能表現與1920x1080差不多,FPS稍低一點點,使用這種顯示器的朋友依然可以參考我們的測試成績。
● 測試平臺電源:Antec HCP1200

安鈦克Antec HCP1200電源在世界超頻大賽中非常常見,通過了80PLUS認證,轉換效率高達92.4%,支持4路12V輸出,最高電流72A,支持四卡SLI/交火。平均無故障運行時間為10萬小時。配備一顆8cm靜音風扇,運行噪音極低。
● 測試平臺SSD:OCZ Vetrx3 240GB

OCZ的Vertex系列屬于它的高端固態硬盤,專門為高端玩家和存儲發燒友設計。隨著Sandforce控制器大紅大紫,OCZ也將Vertex系列升級到了全新的SF1200方案。如今SATA3.0 6Gbps接口大行其道,OCZ推出了基于SF2200系列主控芯片的Vertex 3固態硬盤,涵蓋60-480GB容量范圍。
既然針對平臺不同,測試項目自然也相去甚遠。三大平臺除了PC追求極致性能外,筆記本和平板都受限于電池和移動因素,性能不是很高,因此之前的3Dmark11雖然有三檔可選,依然不能準確衡量移動設備的真實性能。

3DMARK主界面
而這次Futuremark為移動平臺量身定做了專有測試方案,新一代3DMark三個場景的畫面精細程度以及對配置的要求可謂天差地別。

Fire Strike、Cloud Gate、Ice Storm三大場景,他們分別對應當前最熱門的三大類型的電腦——臺式電腦、筆記本電腦和平板電腦。



最新的3DMARK軟件,最嚴苛的Fire Strike Extreme模式中,GTX TITAN以X4417的成績遙遙領先于其它顯卡,Fire Strike Extreme模式的SLI效率也比較高。


3DMark11的測試重點是實時利用DX11 API更新和渲染復雜的游戲世界,通過六個不同測試環節得到一個綜合評分,藉此評判一套PC系統的基準性能水平。
● 3DMark 11的特色與亮點:
1、原生支持DirectX 11:基于原生DX11引擎,全面使用DX11 API的所有新特性,包括曲面細分、計算著色器、多線程。
2、原生支持64bit,保留32bit:原生64位編譯程序,獨立的32位、64位可執行文件,并支持兼容模式。
3、新測試場景:總計六個測試場景,包括四個圖形測試(其實是兩個場景)、一個物理測試、一個綜合測試,全面衡量GPU、CPU性能。
4、拋棄PhysX,使用Bullet物理引擎:拋棄封閉的NVIDIA PhysX而改用開源的Bullet專業物理庫,支持碰撞檢測、剛體、軟體,根據ZLib授權協議而免費使用。


3Dmark11大量特效堆砌出來的以假亂真的畫面讓HD7970和GTX680也不能完全流暢運行它,但GTX TITAN SLI之后我們終于看到了流暢的畫面!
玩電腦硬件的老鳥一定還記得2007年CRYSIS發布時的情形,一款CRYTEK公司的巔峰之作給玩家帶來了前所未有的視覺沖擊,同時也讓當時的旗艦顯卡成了一個笑話。不僅如此,就連N/A兩大顯卡巨頭的下一代的產品也都無法流暢運行這款游戲,一時間顯卡危機的諢號不脛而走!

時過境遷,在摩爾定律的催動下,孤島危機終于也被馴服。2010年以后,游戲畫質的躑躅不前讓硬件逐漸超越了游戲的需要,尤其是去年kepler和GCN架構顯卡發布以后,已經沒有任何游戲可以對旗艦顯卡造成威脅,直到《CRYSIS 3》上市……。CRYSIS 3變態的畫質讓所有人看到了未來游戲的希望,也讓整個情況又戲劇性的回到了2007年的起點,顯卡危機再次來襲!
《孤島危機3》支持大量的高端圖形選項以及高分辨率材質。在游戲中,PC玩家將能看到一系列的選項,包括了游戲效果、物品細節、粒子系統、后置處理、著色器、陰影、水體、各向異性過濾、材質分辨率、動態模糊以及自然光。總而言之:忘了二代吧,CRYSIS 3才是CRYTEK公司想做的產品!
本作的環境設定可謂非常的獨特,我們不妨稱它為城市熱帶雨林,根據Reed所說,在這部作品當中充分的結合了兩代中的元素。當你行進在紐約的時候,你將會注意到那些生長在大廈外的樹木,還有那些廢墟當中茂盛的植被,通過了這些景象你可以了解到Nanodome是如何催化植物生長的。當然,本作中依然有許多的沼澤,荒漠,島嶼場景,當然了,在每一個地方迎接玩家們的是巨大的挑戰。



Crysis 3無疑是迄今為止技術含量最高、顯卡要求最高、畫質最卓越的一款游戲。2560分辨率最高畫質下,單卡GTX TITAN也只能跑21FPS,好在SLI效率不低,雙卡和三卡SLI性能提升明顯,終于可以流暢運行這款游戲了!
由EA DICE工作室開發的《戰地3》采用了最新的“寒霜2”引擎,完美支持DirectX 11,并且擁有強大的物理效果,最大的亮點還是光照系統,其渲染的場景已近乎亂真的地步,視覺效果堪稱絕贊。游戲還支持即時晝夜系統,為玩家營造一個親臨現場的真實環境。

寒霜2引擎最大的特點便是支持大規模的破壞效果。由于考慮到游戲的畫面表現以及開發成本,DICE放棄了以只支持DX9的WINDOWS XP操作系統。另外由于該引擎基于DX11研發,向下兼容DX10,因而游戲只能運行于WINDOWS VISTA以上的的操作系統。
在《戰地3》中,“寒霜引擎2”內置的破壞系統已經被提升至3.0版本,對于本作中的一些高層建筑來說,新版的破壞系統將發揮出電影《2012》那般的災難效果,突如其來的建筑倒塌將震撼每一位玩家的眼球。
《戰地3》采用了ANT引擎制作人物的動作效果。在此之前,ANT引擎已在EA Sports旗下的《FIFA》等游戲中得到應用,不過在FPS游戲中使用尚屬首次。相較于Havok等物理引擎,用ANT引擎可以花費較少的精力制作出逼真的效果。舉例來說,戰士在下蹲時會先低頭俯身、放低槍口,而不是像以前的游戲那樣頭、身、槍如木偶般同時發生位移。此外,ANT引擎也可以讓電腦AI的行動更加合理。但這款大作目前并不能良好的兼容120Hz3D以及紅藍3D模式。



寒霜2引擎大作戰地三,是為數不多的畫面可以挑戰Crysis的游戲大作,而對核心和顯存的要求已經超越了Crysis!而越是要求變態的游戲,GTX TITAN單卡和SLI成績發揮就越穩定!
游戲介紹:《地鐵2033》(Metro 2033)是俄羅斯工作室4A Games開發的一款新作,也是DX11游戲的新成員。該游戲的核心引擎是號稱自主全新研發的4A Engine,支持當今幾乎所有畫質技術,比如高分辨率紋理、GPU PhysX物理加速、硬件曲面細分、形態學抗鋸齒(MLAA)、并行計算景深、屏幕環境光遮蔽(SSAO)、次表面散射、視差貼圖、物體動態模糊等等。
開啟景深,模擬鏡頭感
畫面設置:《地鐵2033》雖然支持PhysX,但對CPU軟件加速支持的也很好,因此使用A卡玩游戲時并不會因PhysX效果而拖累性能。該游戲由于加入了太多的尖端技術導致要求非常BT,以至于我們都不敢開啟抗鋸齒進行測試,只是將游戲內置的效果調至最高。游戲自帶Benchmark,這段畫戰斗場景并不是很宏大,但已經讓高端顯卡不堪重負了。
測試說明:如果說是CRYSIS發動了DX10時代的顯卡危機,那地鐵2033無疑是DX11時代的顯卡殺手!地鐵2033幾乎支持當時可以采用的所有新技術,在畫面雕琢上大肆鋪張,全然不顧顯卡們的感受,和CRYSIS如出一轍。然而CRYSIS靠著特效的堆積和不錯的優化,其驚艷絕倫的畫面和DX9C游戲拉開了距離,終究賺足了眼球;而地鐵則沒有這么好運了,畫面固然不差,BUG卻是很多,招來了大量的非議。



地鐵2033,DX11游戲中的奇葩,素有顯卡殺手之稱,但在TITAN SLI X3面前依然毫無抵抗之力。
游戲引擎開發商BitSquid與游戲開發商Fatshark近日聯合公布了一個展示DX11強大技術的DEMO。這個名為《StoneGiant》(石巨人)的DEMO,可以讓玩家來測試自己PC顯卡的DX11性能。BitSquid Tech即將提供PC平臺的引擎,并且大概在今年第三季度將提供PS3和Xbox 360等其他平臺的引擎。
畫面設置:StoneGiant是一款技術演示Demo,畫面做的非常精美,進入之后可以選擇開啟關閉Tessellation以及DOF(DX11級別景深)進行測試,這兩項技術都十分消耗資源,尤其是同時打開時。其中Tessellation技術對畫質的改善最為明顯,測試時默認開啟Tessellation、打開DOF進行測試。
測試方法:自帶Benchmark。



Stone GiantTITAN依然是SLI效率最高的測試項目之一,尤其在2560分辨率下,三卡SLI達到了單卡性能的255%,6GB的大顯存功不可沒。
《Aliens vs. Predator》同時登陸PC、X360和PS3,其中PC版因為支持DX11里的細分曲面(Tessellation)、高清環境光遮蔽(HDAO)、計算著色器后期處理、真實陰影等技術而備受關注,是AMD大力推行的游戲之一,但是這樣的主題難免讓本作有很多不和諧的地方,暴力血腥場面必然不會少!發行商世嘉在2009年11月就曾明志,表示不會為了通過審查而放棄電子娛樂產品發行商的責任,因為游戲要維持“異形大戰鐵血戰士”這一中心主題,無論畫面、玩法還是故事線都不能偏離。
畫面設置AVP原始版本并不支持AA,但升級至1.1版本之后,MSAA選項出現在了DX11增強特效當中,當然還支持Tessellation、HDAO、DirectCompute等招牌。該游戲要求不算太高,所以筆者直接將特效調至最高進行測試。
測試方法:游戲帶Benchmark,其中測試畫面頗代表意義,很好的體現了Tessellation異形身體以及HDAO等高級特效,希望這些特效能讓系統發揮所有潛力。



AVP的多卡效率非常高,SLI X2即可達到單卡180%的性能,三卡更是高達250%左右,離理論最高成績已經很接近了,可見只要游戲支持優化得當,GTX TITAN擁有非常優秀的SLI價值。
《失落的星球2》的游戲舞臺是前作故事發生后十幾年之后經過溫暖化改變的EDN-3rd,這里將新增叢林等新場景,主人公也并非前作那樣為一人,而是以“雪賊”們不同的視點展開故事。
畫面設置:與前作相同,《失落的星球2》采用CAPCOM公司原創引擎MT Framework的最新版VER.2.0進行開發,游戲世界的表現將更加細致和美麗。而不僅僅是畫面上的進化,本作將會在前作玩家要求基礎上追加大量全新要素,新場景、新角色、新武器等自不必說,角色的動作也比前作更加豐富多彩。
測試方法:游戲自帶Benchmark,開啟全特效+4AA選擇B場景的BOSS戰,非常激烈過癮。



這款經典的DX11游戲對顯卡要求雖然不低,但強大如GTX TITAN自然毫無壓力,就算是2560高分辨率下,三卡SLI依然可以達到100FPS以上的幀速率。效率方面SLI X2較之單卡性能提升約30%,三卡性能提升45%以上。
我們的功耗測試方法是直接統計整套平臺的總功耗,既簡單、又直觀。測試儀器為微型電力監測儀,它通過實時監控輸入電源的電壓和電流計算出當前的功率,這樣得到的數值就是包括CPU、主板、內存、硬盤、顯卡、電源以及線路損耗在內的主機總功率(不包括顯示器)。
FURMARK拷機成績截圖
待機為windows7桌面下獲得的最小值;滿載是以1680X1050模式運行Furmark時的最大值,Furmark能夠讓顯卡穩定的以100%滿負載模式運行,測得的功耗值比一般的游戲要高一些。
● 顯卡空閑整機功耗測試(顯示器除外)

● 顯卡滿載整機功耗測試(顯示器除外)

待機功耗TITAN的表現不盡如人意,整機(不包含顯示器)達到了將近100W,滿載以后功耗控制倒是不錯,只有319W。考慮到TITAN優異的3D性能,這個表現非常不錯,單GTX TITAN Z77平臺,額定功率500W的優質電源就可以勝任。
GTX TITAN SLI X2測試功耗達到了552W,建議想要雙卡SLI的朋友至少搭配750W以上的電源,GTX TITAN SLI X3測試功耗達到了791W,建議想要三卡SLI的朋友至少搭配1000W左右的電源,這樣可以保證一定的余量并且讓電源工作在最高轉換效率附近!
全文總結:
通過本次的測試我們發現,GTX TITAN單卡性能強悍,在多數游戲中SLI效率也非常不錯,總的來說,越是顯卡要求變態的游戲,GTX TITAN多卡SLI的效率就越高,而顯卡要求低的游戲反而SLI效率低下,很大程度上這是因為SLI 3D性能過剩,平臺其他硬件造成瓶頸所至。難能可貴的是,TITAN SLI功耗噪音的控制和穩定性都堪稱優秀,這在以前的旗艦顯卡中并不多見。
Kepler架構終極形態GeForce GTX TITAN的發布,NVIDIA又一次提高了游戲行業的標準,同時以GPU為核心的計算模式再次被發揚光大。Kepler GK110設計的初衷就是利用卓越的電源效率達到最大化計算性能和吞吐量。該架構有很多創新,如SMX、Dynamic Parallelism 和 Hyper‐Q等等,這些功能不僅使混合計算大大簡化,同時也簡化了編程接口,有望催生出更優秀的軟件,適用于更廣泛的應用,相信以后會看到不少基于TITAN SLI組建的工作站出現在人們的視野。■<
關注我們


