游戲體驗最重要!NV顯示技術效果實測
泡泡網顯卡頻道12月27日 當PC硬件的性能達到玩家需求后,接下來還需要什么呢?
下一步的關鍵就是游戲體驗!NVIDIA發布的開普勒架構顯卡,除了帶給用戶更強勁的物理性能外,在驅動與技術上的優化也越來越向游戲體驗靠攏。
08年NVIDIA就推出了PhysX物理加速技術,之后又致力于DX11重要特性Tessellation的研究,推出了曲面細分效率很高的Fermi系列顯卡,而伴隨開普勒產品發布,NVIDIA又帶來了專為改善用戶體驗的新技術,他們分別是針對游戲畫面做出優化的TXAA抗鋸齒、針對畫面撕裂優化的自適應垂直同步。
前兩種技術耳順能詳,后兩種技術可能很多朋友還不是很了解,今天在這里,筆者就將這四大技術一一介紹,看看它們究竟能為我們的游戲帶來什么改變。
若無特別說明,測試時所有游戲中開啟全部特效。雖然很多游戲提供了更高精度的AA,但由于實用價值不高,且沒有可對比性,所以不做測試。

為了做到全面客觀,有對比和參考,分辨率測目前最主流的1920x1080。目前也有部分顯示器是(1920x1200),游戲在這種分辨率下的性能表現與1920x1080差不多,FPS稍低一點點,使用這種顯示器的朋友依然可以參考我們的測試成績。
參測顯卡介紹:GeForce GTX 660Ti/660
GeForce GTX 660和GeForce GTX 660Ti一樣采用了2GB 192Bit顯存
基于效能和計算能力方面的考慮,NVIDIA與AMD不約而同的改變了架構,NVIDIA雖然還是采用SIMT架構,但也借鑒了AMD“較老”的SIMD架構之作法,降低控制邏輯單元和指令發射器的比例,用較少的邏輯單元去控制更多的CUDA核心。于是一組SM當中容納了192個核心的壯舉就變成了現實!
通過上面這個示意圖就看的很清楚了,CUDA核心的縮小主要歸功于28nm工藝的使用,而如此之多的CUDA核心,與之搭配的控制邏輯單元面積反而縮小了,NVIDIA強化運算單元削減控制單元的意圖就很明顯了。
開普勒中NVIDIA將一大部分指令派發和控制的操作交給了軟件(驅動)來處理。而且GPU的架構并沒有本質上的改變,只是結構和規模以及控制方式發生了變化,只要驅動支持到位,與游戲開發商保持緊密的合作,效率損失必然會降到最低——事實上NVIDIA著名的The Way策略就是干這一行的!
The Way(游戲之道)計劃可以保證NVIDA的GPU架構與游戲完美兼容
開普勒核心:SMX與SM的改動細節
全新的Kepler相比上代的Fermi架構改變了什么,看架構圖就很清楚了:

Fermi GF100/GF110核心架構圖
GeForce GTX 660(GK106)核心架構
GeForce GTX 660的核心非常奇特,擁有5組SMX單元,“兩個半”GPC。莫非是受到Tegra3五核心的啟發?
NVIDIA把GK104的SM(不可分割的流處理器集群)稱為SMX,原因就是暴增的CUDA核心數量。但實際上其結構與上代的SM沒有本質區別,不同的只是各部分單元的數量和比例而已。具體的區別逐個列出來進行對比:

通過以上數據對比不難看出,GK104暴力增加CUDA核心數量的同時,SFU和TMU這兩個與圖形或計算息息相關處理單元也同比增加,但是指令分配單元和線程調度器還有載入/存儲單元的占比都減半了。這也就是前文中提到過的削減邏輯控制單元的策略,此時如何保證把指令和線程填滿一個CUDA核心,將是一個難題。
鋸齒現象主要是因為在對比度反差較大的物體邊緣上出現對比度較高的不平滑的間斷線所導致。傳統的抗鋸齒算法如MSAA等會采用更高的計算精度,讓物體邊緣的高對比度部分對比度降低、間斷尺寸變短,鋸齒則會出現明顯的減弱。而后處理抗鋸齒則通過檢查這些間斷的線段,并利用特殊的算法(一般是有方向性的模糊)將鋸齒部分本身模糊化、同時也降低邊緣部分原本非常明顯的對比。
后處理抗鋸齒技術以較低的資源損耗和不錯的抗鋸齒效果,成為未來抗鋸齒技術發展的重要方向。AMD推出過MLAA,NVIDIA也推出了自家的FXAA,但它們都不完美,降低鋸齒的同時,都可能損害游戲畫質,例如紋理變模糊和字體破壞。出現這種問題的原因,主要是這些后處理AA的處理位置實在是太“靠后”了,甚至在畫面完成后才進行采樣處理,因此會對不需要進行AA處理的部位也做一些不恰當的抗鋸齒操作,最終導致畫面模糊。
作為后處理抗鋸齒的一種,TXAA的基本原理和傳統后處理抗鋸齒基本相同。但TXAA和MLAA以及FXAA不同的是,后兩種技術一般會在畫面處理的最后時刻才發生作用,往往會“誤傷”很多本來不該做抗鋸齒的內容。TXAA則不會直接出現在驅動中,而是和游戲廠商以及游戲引擎合作,在游戲中直接植入TXAA。這樣就可以將后處理放在恰當的位置,比如在紋理貼圖之前就先標定需要做抗鋸齒的部位,或者干脆只對檢測到的幾何體邊緣做抗鋸齒操作,從而避免了字體模糊誤傷現象的出現。在抗鋸齒算法上,TXAA由于能夠精確鎖定鋸齒出現的部位,因此能夠采用效果優秀的算法,帶來更優秀的圖形畫質。
《使命召喚:黑色行動2》是美國動視暴雪旗下的使命召喚系列游戲最新作品。與前幾代不同的是,游戲劇情將安排在《黑色行動》故事后的2025年,劇情里中國和美國都被卷入這場21世紀的冷戰之中。《使命召喚:黑色行動2》是Treyarch開發,也是《使命召喚:黑色行動》的正統續作。本作將帶領玩家進入未來戰爭。本作依舊沿用IW引擎,但令人高興的是加入了DX11技術以及TXAA的支持,可謂一大進步。
在使命召喚9中開啟不同抗鋸齒的畫質表現(點擊查看原圖)
除此之外,TXAA還有傳統抗鋸齒算法所不具備的另一大優點。眾所周知制作CG電影的電影制片廠會在抗鋸齒方面花費大量的計算資源,其中非常重要的一個流程就是減少幀之間的場景抖動,從而可確保觀眾不會因閃爍的鋸齒狀線條而分心,而這種閃爍的鋸齒狀線條又稱作時間性鋸齒。
TXAA的優點
與CG電影中所采用的技術類似,TXAA新加入了幀之間的場景抖動采樣功能,以減少閃爍情形,消除時間性鋸齒效果明顯。目前,TXAA有兩種模式:TXAA 2X和TXAA 4X。TXAA 2X效果接近8X MSAA的視覺保真度,然而所需性能卻與2XMSAA接近;TXAA 4X的圖像保真度勝過8XMSAA,所需性能僅僅與4X MSAA相當。
與NVIDIA合作的游戲/廠商
支持TXAA技術的游戲將會在今年晚些時候逐漸登場,已經確定要發行的作品包括:機甲戰士在線(MechWarrior Online)、神秘世界(Secret World)、星戰前夜在線(EVE Online)、無主之地2(Borderlands 2),而BitSquid、Slant Six Games、虛幻4引擎、Crytek(代表作:孤島危機)也都將推出采用TXAA技術的作品。
眾多后處理抗鋸齒技術(Post Process Anti-Aliasing)雖然憑借高效率紅極一時,但終究不算完美。NVIDIA在新一代開普勒GPU上開始支持TXAA,這個全新的后處理抗鋸齒技術無疑將成為抗鋸齒技術發展史上的重要里程碑。
很多人都知道垂直同步可以防止游戲畫面產生撕裂現象,所以我們玩游戲的時候,首先會在游戲設置中開啟垂直同步的選項。但是各位有多少人知道垂直同步的工作原理呢?開啟垂直同步還有什么利弊呢?在這里,我們先來了解一下傳統的垂直同步功能是怎樣工作的。
如今60Hz刷新率的液晶顯示器已經普及,當玩家在游戲中開啟垂直同步后,幀速將會鎖定在60幀。這樣雖然防止了畫面撕裂情況的產生,但衍生出了一個新的問題——畫面遲滯。在開啟垂直同步后,如果顯卡性能在某些游戲場景中無法滿足60幀的幀速,這時便會產生畫面遲滯現象。
造成這種現象的原因是傳統的垂直同步無法根據幀速度動態調整,就好比你去趕公交車,雖然你可能只遲到了幾秒鐘,但只能搭載下一班車,為此付出等待半小時的代價。如果你的顯卡無法滿足60幀的幀速度需求,哪怕是59幀,游戲幀數也將直接降至下一檔30FPS,幀速的突然大幅下降必然會讓玩家產生畫面遲滯的感覺。而如果這種情況頻繁發生,傳統垂直同步會讓你的游戲體驗一團糟。
自適應垂直同步就是為了解決這一問題而生,自適應垂直同步具有傳統垂直同步的所有功能,而且還可根據幀速率動態調整。就好比司機知道你什么時候來,如果快趕到車站了,那班車會非常人性化的等你,你就不會因為晚了一分鐘而耽誤半個小時。這樣就減少遲滯現象的產生,為玩家提供更加流暢的游戲體驗。
官方驅動306.23以后的驅動版本中,3D設置里我們可以看到垂直同步的最新選項。其中包括使用3D應用程序設置、關、開、自適應、自適應(半刷新率)等五個選項。其中使用3D應用程序設置自然就是根據程序自身的設定選擇開啟還是關閉垂直同步。關則是強制關閉垂直同步功能,開則是強制開啟傳統垂直同步。選擇自適應則可以開啟NVIDIA自適應垂直同步功能,開啟后游戲運行幀數將不會超過60FPS;最后一項自適應(半刷新率)則是幀數限制為30FPS的自適應垂直同步功能。需要補充的是,自適應垂直同步功能僅限在游戲全屏顯示下才可生效,用窗口模式進行游戲則無法生效。
《Far Cry 3》是育碧旗下FPS大作《Far Cry》系列的最新續作,由育碧蒙特利爾主力開發,育碧上海和育碧Massive協力開發,采用了全面升級的Dunia引擎,12月登陸PS3、Xbox360和PC三大平臺。開發世界射擊游戲《孤島驚魂3》不前往非洲,與它的初代一樣,將前往不知名的熱帶叢林島嶼。針對這座神秘的島嶼,創意制作人 Dan Hay表示所有玩家都會為之瘋狂。
不開啟自適應垂直同步,幀數會飚到70多,但畫面會有撕裂感。
在驅動中打開自適應垂直同步,關閉游戲自帶的垂直同步選項,可以看到幀數穩定在了60FPS(顯示62為軟件誤差)。
開啟垂直同步的好處
一、開啟垂直同步以后,幀數鎖定60FPS,這時候顯卡并不會滿負載運行,發熱噪音和功耗都會比不開啟垂直同步要小,越是高端顯卡效果越明顯。
二、上文說到的防止畫面撕裂。
三、防止異常幀渲染時間過長發生卡頓。

每幀渲染時間測試(單位:毫秒)
打開垂直同步后,游戲畫面FPS數能達到或超過你顯示器的刷新率,這時游戲畫面FPS數被限制為你顯示器的刷新率,畫面流暢平滑,同時還能防止高速移動時游戲畫面出現的撕裂現象
自適應垂直同步的優點
根據傳統垂直同步的工作原理,我們不難分析出,當你的硬件性能完全勝任一款游戲時,傳統垂直同步與自適應垂直同步都將會把幀數鎖定在60FPS,這時兩者并無差異。而當你的硬件性能僅能讓游戲運行在60FPS左右時,自適應垂直同步依然可以讓你流暢運行游戲而不會發生卡頓,這是傳統垂直同步無法達到的。
說起曲面細分,想必大家都很熟悉。從DX11發布開始,這個名字就頻頻曝光于各大硬件媒體。簡單所來,它就是利用模塊化的算法將本來不是非常細膩的模型頂點細化,從而得到更加細膩的新模型,這種算法具備智能、高效的特點。
以GPU領域領軍者自居的NNVIDIA認為,曲面細分技術所代表的GPU幾何性能是新一代顯卡最重要的功能,也是DirectX 11重要的組成部分。而從GPU的發展歷程也可以看出,像素處理能力增長速度遠遠超過了幾何性能的增長速度,幾何性能已經成為制約GPU性能的瓶頸,所以從Fermi到Kepler,NVIDIA刻意加強了GPU的幾何處理能力,曲面細分首當其沖獲得BUFF。
NVIDIA通過PolyMorph Engine,將Tessellation任務分配給CUDA單元處理。擁有多少個PolyMorph Engine,也就等效于擁有多少個具有Tessellation技術處理能力的單元。
《光榮使命》最初是面向部隊廣大官兵而開發的網絡軍事游戲,由南京軍區與無錫巨人公司攜手歷時2年研發完成。作為國內第一款具有自主知識產權的大型局域網軍事游戲,軍用版光榮使命一直頗受玩家關注。《光榮使命》民用版畫面比之前的軍用版更上一層樓,支持了DX11以后,畫面效果已經達到了國內領先水平。但想要完美體驗這款大作,只憑顯卡性能強勁是遠遠不夠的,Tessellation和PhysX物理加速在其中起到了至關重要的作用!
開啟DX11 Tessellation的效果非常明顯,Tessellation技術生成的是實實在在的頂點和曲面,所有的巖石、臺階和石塊都是獨立存在,而不再是平面上的虛擬貼圖而已。
而如果不支持PhysX,很多場景中應當出現的東西就無法正常顯示,布料旗幟、火星、煙霧和爆炸效果的憑空消失讓人感覺莫名其妙,大大影響了游戲體驗。
NVIDIA這樣做的優點在于,可以在高曲面細分負載下獲得優秀的曲面細分能力,也就是在純Tessellation計算中GPU的幾何性能相當出色。無論AMD如何優化,在單純的Tessellation計算中,NVIDIA顯卡的Tessellation處理能力依然數倍于A卡。
如果是Tessellation是NVIDIA占優的話,PhysX物理加速技術則是N卡的專利。2008年,在Intel收購了物理引擎界的領軍者Havok后,Nvidia也收購了排名第二的AGEIA,自此正式將PhysX技術劃入旗下。
現在我們所談論的PhysX物理加速確實承襲自AGEIA PhysX,但可謂青出于藍。因為NVIDIA在AGEIA PhysX基礎上推出的NVIDIA PhysX物理加速是無縫植入NVIDIA GPU中,用戶不必額外購買PhysX物理加速卡就能享受到PhysX物理加速功能。借助CUDA架構,NVIDIA重新編寫了PhysX物理加速程序,將PhysX物理加速引擎從AGEIA PPU移植到了NVIDIA GPU上。
通過重新編寫程序,NVIDIA GPU中的線程調度器將接替了原來PPU中“控制引擎”的工作,負責具體任務的指派;流處理器將承擔原來PPU中“矢量處理引擎”的工作,即負責物理計算;在物理計算完成后,由DME來負責輸出;而后,GPU再通過硬件抽象層實現布料模擬、毛發模擬、碰撞偵測、流體力學等物理技術。簡而言之,就是利用CUDA,將PhysX引擎中的計算指令,翻譯給GPU,讓GPU去計算。GPU具有優秀的浮點計算能力和并行處理能力,運行這些任務如魚得水,CPU難以承受之重,交給GPU事半功倍。
通過這種方法,NVIDIA目前全系列的顯卡都可以支持PhysX物理引擎的計算,也就是支持PhysX物理加速。所謂PhysX物理加速,是指相對于CPU來講,GPU加快了PhysX物理引擎的計算速度。并不是說PhysX引擎只能由GPU處理。
蝙蝠俠阿卡姆之城是蝙蝠俠系列的又一個經典之作,制作者深刻領會了蝙蝠俠真正的核心,打造出這一款融合前作以及其他作品優點的獨特的動作冒險之作,給了我們少有的游戲體驗。整體畫面非常棒,將虛幻3引擎的效果完美運用。不管是城中的細節:陰冷潮濕的下水道、骯臟破敗的街巷角落;還是整個阿甘城黑暗神秘的建筑群,飛絮般散落漸漸融化的雪花,都表現的相當出色。游戲中各個角色的建模也是很細致,各具特點;豐富的臉部表情加上各自的配音,讓玩家更好的代入其中享受。一座理想中陰森恐怖而又不失美觀神秘的犯罪之城,各個鮮明的大反派,顯然游戲制作者將虛幻3引擎用到了真正需要的地方。但如果沒有PhysX物理加速的支持,整個游戲畫面就會變的平淡無奇,下面是游戲實際截圖。
在蝙蝠俠中,沒有PhysX物理加速效果以后會看不到煙霧
碰撞和破碎效果只有支持PhysX的顯卡才能正確顯示
事實上NVIDIA曾承諾PhysX加速技術是公開的,且支持第三方廠商讓PhysX運行在競爭對手ATI的顯卡上,然而當2010年ATI HD5000系列產品開始對N卡構成威脅時,NVIDIA放棄了之前的想法。由此也可以看出PhysX加速技術的戰略意義之重要。
其次,在設計上,NVIDIA顯卡是同時進行3D計算和物理計算,且顯卡不斷的在3D計算和物理計算模式間切換。目前的顯卡已經被高分辨率、高全屏抗鋸齒等壓的喘不過氣來,很多情況下沒有剩余精力再去計算PhysX指令。因此低端的單顯卡運行PhysX游戲,雖然效果上更加逼真,卻難以達到流暢標準,得不償失。想要真正體驗物理加速的魅力,至少得擁有中端或以上級別的NVIDIA顯卡。
PhysX的未來完全掌握于NVIDIA之手。目前Physx是作為NVIDIA宣傳自家顯卡的賣點,但和Intel Havok引擎相比,普及型還是不及。應用程序常見于虛幻3引擎,NVIDIA推行的“游戲之道”計劃中,PhysX也是核心技術,NVIDIA會極力撮合使用虛幻3引擎的游戲開發商支持PhysX,同時不斷說服其它游戲引擎加盟。
封閉保護是把雙刃劍,PhysX作為NVIDIA的專利,是僅僅作為顯卡賣點保持對AMD的優勢的工具,還是能發揚光大現在還不甚明朗。NVIDIA也曾宣稱PhysX在一定范圍內免費開放,而我們希望在以后的游戲大作中都能有它的身影。
總而言之,TXAA消除了動態鋸齒,Tessellation提供了免費的模型精細度,自適應垂直同步讓畫面更加平滑流暢,PhysX讓模型互動更加真實。在顯卡性能不相上下的前提下,TXAA、自適應垂直同步、強大的曲面細分能力和PhysX物理加速四種技術無疑可以提供更好的游戲體驗,NVIDIA秉承游戲之道的發展理念,目前在新技術應用方面走在了時代的前沿。■<
關注我們


