HD7950權威首測!鏖戰新舊2代4大卡皇
泡泡網顯卡頻道2月7日 顯卡市場經歷了一年的冷淡期,直到HD7970發布,才掀起一次狂潮,目前高端單芯顯卡被GTX580和HD7970壟斷。HD7970較GTX580優勢明顯,所以價格也高高在上。但是從現在起享受強勁的圖形性能,我們又多了一種選擇。這一天,全世界的高端玩家們不用再為HD7970的高價而發愁了。同樣為28nm制造,全新的GCN次世代圖形架構,支持DX11.1+PCIE3.0,包含1792個流處理器的HD7950如約而至。
時隔HD7970發布22天后AMD再次為我們帶來一場圖形的盛宴,HD7950雖然舍棄了部分性能,但是拒絕了HD7970的高成本、高價格。如果因為HD7970過于昂貴而無法割舍GTX580,那么您有了新的選擇,因為HD7950來了!
HD7950能帶給我們什么?具體規格又有如何精簡?相比上一代顯卡有何進步?對比旗艦HD7970性能上又有何損失?跟GTX580比又有何優勢?今天筆者將為大家揭開HD7950的神秘面紗。
次高端顯卡往往由旗艦級的核心屏蔽而來,這主要也是考慮到用戶的需求、消費能力以及良率問題。比如GTX580和GTX570、HD6970和HD6950的關系。大家可能注意到了,為企業帶來最大利潤的往往不是旗艦產品,而是中高端性能級產品,因此HD7950及HD7800系列從很大程度上決定了AMD今后一年內在顯卡領域的作為。
HD7970與HD7950規格對比
HD7950相對于HD7970而言,屏蔽了4組GCN共計256個流處理器和16個紋理單元。頻率也較925/5500MHz降為800/5000MHz。但是功耗卻降為200W,因此僅需2個6PIN輔助供電接口。這將會對Tahiti核心造成多大的性能損失?還能否一人之下萬人之上?請看小編為您娓娓道來。
HD7950的核心架構圖(被屏蔽的GCN陣列可能出現在任意位置)
GCN陣列微觀結構(內含64個流處理器和4個紋理單元)
如上圖所示,HD7950相比HD7970,在規格上只是被屏蔽了四組GCN陣列,最終結果就是流處理器和紋理單元有所減少,光柵單元和顯存位寬沒有任何損失,所以筆者認為HD7950的規格刪減還是很厚道的。
在前不久HD7970發布時,在我們的首發評測文章《5年架構大革命!HD7970脫胎換骨全測試》已經對Tahiti核心技術與架構進行了全面介紹,因此本文只做簡要介紹,因為HD7970與HD7950除了性能有差別之外,技術、架構、功能方面沒有任何區別。
Tahiti的核心架構圖
這是AMD官方公布的Tahiti核心架構圖,第一眼看上去,我們就會發現他與以往所有的AMD GPU架構有了明顯區別,無論圖形引擎部分還是流處理器部分都有了天翻地覆的變化,如果沒有右側熟悉的UVD、CrossFire、Eyefinity等功能模塊,很難相信這是一顆AMD的GPU。
先看看最上面的圖形引擎部分
Tahiti的圖形引擎部分
Cayman的圖形引擎部分
這一部分Tahiti幾乎沒有什么變化,依然是雙圖形引擎的設計,幾何著色指令分配器、頂點著色指令分配器、曲面細分單元、光柵器、分層消影器都是雙份的設計。
毫不起眼但意義重大的改進:雙ACE
除此之外,還有一個毫不起眼但是意義重大的改進,那就是在圖形引擎上方加入了兩個ACE(Asynchronous Compute Engine,異步計算引擎),這兩個引擎直接與指令處理器、幾何引擎及全局數據緩存相連,作用是管理GPU的任務隊列,將線程分門別類的分發給流處理器。
ACE將會充當指令處理器的角色用于運算操作,而ACE的主要作用就是接受任務并將其下遣分配給流處理器(主要是分配的過程)。全新架構強化了多任務的并行處理設計,資源分配、上下文切換以及任務優先級決策等等。ACE的直接作用就是新架構擁有了一定程度的亂序執行能力,雖然嚴格意義上新架構依然是順序執行架構,一個完整線程中的指令執行順序不能被打亂,但是ACE可以做到對不同的任務進行優化和排序,劃分任務執行的優先級別,進而優化資源。從本質上來說,這與很多CPU(比如Atom、ARM A8等等)處理多任務的方式并沒有什么不同。
而且ACE的加入大幅提升了Tahiti的幾何性能,并且使得通用計算時的指令分配更加有序和并行化,緩存使用率和命中率更高。
有針對性的強化曲面細分單元
單從數量上來看,Tahiti明顯不如GF100的4個光柵化引擎(光柵器+分層消影器)以及8個多形體引擎(幾何/頂點分配器及曲面細分單元等)。不過AMD有針對性的強化了曲面細分單元,通過提高頂點的復用率、增強片外緩存命中率、以及更大參數高速緩存的配合下,HD7970在所有級別的曲面細分環境下都可以達到4倍于HD6970的性能:
此前我們介紹過,HD6970的曲面細分性能是HD6870的兩倍、HD5870的三倍。通過AMD的理論數據來看,Tahiti的曲面細分性能應該達到甚至超越了GF100/110。
看得出來,AMD的Tahiti在圖形引擎方面依然沿用Cayman的設計,從Cypress到Barts再到Cayman,AMD穩扎穩打的對圖形引擎進行優化與改進,AMD認為現有的雙圖形引擎設計足以滿足流處理器的需要,因此只對備受詬病的曲面細分模塊進行了改良,如此有針對性的設計算是亡羊補牢、為時不晚。
看了上頁圖形引擎部分的介紹,很多人可能會失望——基本沒動嘛,還說什么次世代圖形核心?別著急,好戲在后頭。我們知道AMD歷代GPU的瓶頸除了曲面細分以外,其實最重要的是5D/4D VLIW架構的效率問題。現在Tahiti的GCN架構就是要解決這個問題,它的流處理器結構已經面目全非了。
Tahiti徹底拋棄VLIW架構
通過Tahiti的整體架構圖我們看到,傳統的SIMD流處理器陣列消失了,取而代之的是GCN陣列,Tahiti總計擁有2048個流處理器,這樣每個GCN陣列里面擁有64個流處理器。現在來看看GCN陣列的微觀結構。
GCN與GF100的SM何其相似
Tahiti的GCN陣列微觀結構
GCN陣列里有4組SIMD單元,每組SIMD單元里面包括16個流處理器、或者說是標量運算器。GCN架構已經完全拋棄了此前5D/4D流處理器VLIW超長指令架構的限制,不存在5D/4D指令打包-派發-解包的問題,所有流處理器以16個為一組SIMD陣列完成指令調度。簡單來說,以往是指令集并行,而現在是線程級并行。
GF100的SM(流處理器簇)微觀結構
可以這么理解,一個GCN陣列與GF100當中的一組SM相當,GF100的一組SM當中有4組共計32個流處理器,而Tahiti的一組GCN當中有4組共計64個流處理器。
緩存部分
每個SIMD-16單元都擁有64KB向量寄存器
每組GCN陣列擁有64KB的本地數據共享緩存,還有16KB的一級緩存
每組GCN陣列有一個標量運算單元,用于執行整數指令、媒體指令和浮點原子操作,這個標量運算單元擁有自己的4KB寄存器
而GF100的緩存設計得更加靈活,每組SM里面擁有總計64KB的共享緩存+一級緩存,這64KB緩存可以根據實際運算量來動態調整,如果把16KB分配給一級緩存的話,那剩下的48KB就是共享緩存,反之亦然。
一般來說,進行圖形渲染時需要共享緩存比較多,而并行計算時則會用到更多的一級緩存。GF100這種靈活的緩存分配機制更適合做并行計算,而GCN架構更大的共享緩存會有更好的圖形渲染性能,并行計算則會稍遜一籌。
更多的線程調度
從緩存部分的設計來看,雖然GCN擁有更大的緩存容量,但在并行計算領域經營多年的NVIDIA顯然要棋高一手。
從線程級別來看,GCN與SM是不可分割的最小單元,GCN一次可以執行64個線程,而SM是48個(其實就是流處理器的數量)。
從多線程執行上來看,GCN可以同時執行4個硬件線程,而SM是雙線程調度器的設計(參見架構圖)。
如此來看,GCN架構的多線程性能會更好一些。
小結:AMD GCN借鑒NVIDIA SM架構
在流處理器部分,終于不用費勁的把AMD和NVIDIA GPU架構分開介紹了,因為GCN與SM已經沒有本質區別。剩下的只是緩存容量、流處理器簇的數量、線程調度機制的問題,雙方根據實際應用自然會有不同的判斷,自家的前后兩代產品也會對這些數量和排列組合進行微調。
AMD向NVIDIA的架構靠攏,GCN架構改動之大,前所未有!
在流處理器部分,我們看到Tahiti與GF100如此相似,那么接下來看到緩存設計時,您可能會要驚呼了……看圖說話:
Tahiti的緩存結構
Tahiti與GF100緩存的相同之處
先說最直觀的,Tahiti有一個容量為768KB二級緩存,這個容量與GF100的L2完全相同,都可以進行讀寫操作。
上頁說過,Tahiti的每組GCN陣列擁有16KB的一級緩存,GF100的SM里面也有16KB的一級緩存;每組GCN擁有64KB的本地數據共享緩存,GF100的每組SM擁有48KB。
Tahiti總共擁有32個GCN陣列,所以一級緩存共有512KB,而GF100擁有16個SM陣列,一級緩存共有256KB。但別忘了GF100的L1可以是48KB,這樣總共就是768KB了。
Tahiti與GF100緩存的不同之處
雖然Tahiti的緩存層級設定與GF100非常相似,但區別也是有的:
Tahiti的每組GCN需要將16KB一級緩存當作紋理緩存使用,而GF100的每組SM當中設有專用的12KB紋理緩存;
一般來說非圖形渲染不需要用到紋理緩存,而圖形渲染時又不會用到一級緩存,所以Tahiti將一級緩存與紋理緩存合并的設計更優;但NVIDIA專門設計紋理緩存也不是沒有道理,當GPU既渲染圖形又要做計算時,分離式設計的效率會更高,比如PhysX游戲……A卡不支持所以AMD不會考慮這種情況。
Tahiti整個GPU擁有一個32KB的全局數據共享緩存,這個是沿用了Cayman的設計,但容量減半了,而GF100沒有這種緩存。全局數據共享緩存主要用于不同GCN陣列間線程的數據交換,這塊緩存只對編譯器可見,所以使用率較低,容量減半相信也是處于這個原因。
最核心的流處理器和緩存部分介紹完畢,剩下的功能模塊就簡單了:
AMD頭一次使用384bit顯存控制器
我們先來回顧一下顯存控制器的發展史:
NVIDIA:G80(384bit)-G92(256bit)-GT200(512bit)-GF100(384bit)
AMD:R600(512bit)-RV670(256bit)-RV770(256bit)-Cypress(256bit)-Cayman(256bit)
NVIDIA使用過兩次384bit顯存控制器,而AMD自R600 512bit兵敗之后一直堅守256bit的設計,這次Tahiti是頭一次使用384bit這種折衷的位寬。
AMD作為GDDR5顯存標準的制定者之一,對于顯存特性吃得比較透,因此同樣的顯存顆粒,A卡的顯存頻率一直都遠高于N卡。此次AMD在位寬上追平NVIDIA,再加上更高的頻率,顯存帶寬達到了264GB/s,基本上不會有什么瓶頸了。
光柵單元數量不變
Tahiti配備了32個ROPs,數量與Cayman,每個周期能完成32個色彩處理和128個Z/Stencil 處理,不過得益于有更高的顯存帶寬,在實際游戲中的性能要比理論值一樣的Cayman快50%,比如抗鋸齒方面。
● PCI-E 3.0總線解析
PCI-E 3.0規范將數據傳輸率提升到8GHz|8GT/s(最初也預想過10GHz),并保持了對PCI-E 2.x/1.x的向下兼容,繼續支持2.5GHz、5GHz信號機制。基于此,PCI-E 3.0架構單信道(x1)單向帶寬即可接近1GB/s,十六信道(x16)雙向帶寬更是可達32GB/s。
PCI-E 3.0同時還特別增加了128b/130b解碼機制,可以確保幾乎100%的傳輸效率,相比此前版本的8b/10b機制提升了25%,從而促成了傳輸帶寬的翻番,延續了PCI-E規范的一貫傳統。
新規范在信號和軟件層的其他增強之處還有數據復用指示、原子操作、動態電源調整機制、延遲容許報告、寬松傳輸排序、基地址寄存器(BAR)大小調整、I/O頁面錯誤等等,從而全方位提升平臺效率、軟件模型彈性、架構伸縮性。
至于PCI-E 3.0總線的意義,現在看來有些超前。目前只有Intel的X79+i7-3960X平臺才會提供PCI-E 3.0支持。根據經驗和測試,PCI-E 3.0翻倍的帶寬并不會給顯卡帶來性能提升,其主要意義還是進一步對于多卡的支持。試想,如果PCI-E 3.0 X4都可以滿足HD7970的需求的話,那么現有的Z68(搭配IvyBridge處理器)就不會限制多路交火的性能表現,而X79插8塊(如果主板有這么多插槽的話)HD7970做并行計算也不會因為接口帶寬而產生性能瓶頸。
一如其在DX10.1上的率先支持一樣,HD7970/50的發布也讓AMD再一次在DX規格支持上獲得領先。DX11.1,相比目前廣泛應用的DX11規范,它的升級能帶來什么樣的技術改變,需要什么樣的軟件平臺,什么時候才有支持DX11.1的游戲或者應用呢?
GCN架構圖中明確指示說支持“下一代圖形API”,也就是DX11.1了
● DX11.1升級了什么?
從小數點后的步進來看,DX11.1只是一次版本上的小步快跑而非大步飛躍,所以不會有什么激動人心的功能變化,但是這不代表DX11.1沒有亮點,相反DX11.1的看點還是挺多的。
1.加入3D立體支持
DX11發布后的這兩年,DX圖形技術沒啥變化,但是伴隨3D電影興起的3D游戲也火了起來,體驗過3D游戲之后大多數人都會覺得很震撼(也有人覺得很暈),栩栩如生的感覺不再是“科幻”。DX11.1很重要的一點改進就是增加了D3D 3D API,可以讓開發者通過D3D實現3D渲染。
微軟提供通用3D立體顯示支持可謂DX11.1眾多新功能中最耀眼的一個了
之所以這么說是因為目前實現3D立體顯示的技術要么是部分繞過D3D API而使用四倍緩沖器(Quad Buffer)實現3D游戲或應用,要么就是利用驅動/中間件實現的。在DX11.1中,3D渲染可以通過新增的D3D API實現,而且微軟的D3D 3D API并非排他性的,依然支持其他驅動/中間件方案。換句話就是DX11.1之后,開發者多了一個實現3D的選擇。
2.支持TBDR渲染
TBDR(Tile Based Deferred Render,延遲渲染貼圖)也是DX11.1中新增的一個操作指令。它原本是Power VR公司使用的3D渲染技術,主要用在智能手機以及平板、游戲機等設備上。與傳統z緩沖的渲染過程相比,TBDR不需要渲染不可見像素,這樣極大地減少了數量運算量,非常適合移動設備使用。
這項技術對桌面圖形計算來說并沒有太大意義,只是DX11.1并不只會用在桌面顯卡上,還承載著微軟擴張移動領域疆土的希望,TBDR依然是DX11.1中的重要功能,低功耗設備的福音。
3.TIR目標獨立光柵化
TIR(Target Independent Rasterization,目標獨立光柵化)的功能要求有所不同,因為前面的兩項技術只需升級DX11.1運行時程序即可,而TIR卻需要更改硬件設計,因此只有新一代顯卡才能支持,無法在原有顯卡上直接升級。
Rasterization光柵化是圖像處理的后期過程,DX11.1支持目標獨立光柵化,可以將原本CPU負責的工作完全轉移到GPU上,進而提高D2D的抗鋸齒性能。
4.支持雙精度浮點運算
雙精度浮點運算(Double-precision shader functionality)或者叫FP64不僅在GPU計算上意義非凡,在圖形渲染中也大有用武之地。雖然DX11中其實已經包含了FP64雙精度支持,但是功能有限,DX11.1中才真正實用化。
5.圖形與視頻之間的操作性更靈活
DX11.1強化了圖形、視頻等各種資源之間的操作靈活性,比如計算渲染器(Compute Shader)可以通過Media Foundation處理視頻(video),并將以前的D3DDX9、D3DX10視頻處理全部統一到D3DX11中去,可以簡化編程,提高效率。
以上列舉的只是DX11.1規范功能升級的一部分,在微軟的MSDN頁面上有詳細的DX11.1功能介紹,不過里面的內容主要針對開發者/程序員,普通讀者讀起來肯定頭大,我們也不需要搞這么復雜。
簡單來說,DX11.1相對DX11只是一次優化升級,但是從DX10到DX10.1性能有提升的經驗來看,DX11.1可能也有小小的驚喜,即便畫質上沒有提高,性能也會因效率的提高而受益多多。
● DX11.1什么時候發布,支持平臺如何?
微軟之前稱DX11.1將伴隨Win8一起發布,不過Win8開發者預覽版上還是DX11,至少也要等到Win8 beta之后了,時間上差不多是明年2月份,最慘的就是要等待正式版發布了,這個就沒準了。由于軟硬件平臺都沒準備好,所以目前還沒有一個基于DX11.1的游戲或者demo,不知道一向敢為人先的Unigine公司什么時候放出第一個DX11.1 demo。
DX11.1走向實用還要等Win8發布之后
綜上來看,DX11.1只是顯卡架構升級中的小甜點,不能當成大餐,不過甜點也有自己獨特的味道,就看廠商如何應用了。AMD先發制人,又一次用行動證實了自己在支持DX11規范上的領先。
根據國外網站消息,除了已經發布的HD7970和HD7950外,所有Radeon HD7700/7800/7900詳細規格和售價已經全面曝光,其中雙芯的Radeon HD 7990售價高達849美元。
整體上由于采用了全新的設計架構,新的南方群島顯得性價比稍微偏低,不過在中低端市場AMD也拿出了只有139美元的Radeon HD 7750,另外AMD還將推出HD 6000系列的28nm版本,型號將被更改為HD 7000系列。
HD 7000系列顯卡包括New Zealand、Tahiti、Pitcairn、Cape Verde的11款產品,型號分別為Radeon HD 7990(6GB)、Radeon HD 7970(3GB)、Radeon HD 7950(3GB)、Radeon HD 7950(1.5GB)、Radeon HD 7890(1.5GB)、Radeon HD 7870(2GB)、Radeon HD 7850(2GB)、Radeon HD 7850(1GB)、Radeon HD 7790(1GB)、Radeon HD 7770(1GB)、Radeon HD 7750(1GB)。
其中Radeon HD 7990(6GB)、Radeon HD 7970(3GB)、Radeon HD 7950(3GB)、(1.5GB)、Radeon HD 7890(1.5GB)采用了Tahiti GPU,擁有384Bit顯存位寬。
接下來的Radeon HD 7870(2GB)、Radeon HD 7850(2GB)、Radeon HD 7850(1GB)基于Pitcairn GPU,都配備了256Bit顯存位寬。而Radeon HD 7770(1GB)、Radeon HD 7750(1GB)則采用了Cape Verde GPU,只有128Bit的顯存位寬。
除了剛剛發布的HD7970和1月26號發布的HD 7950(3GB),AMD將于2012年2月發布性能級別的Radeon HD 7870(2GB)、Radeon HD 7850(2GB)、Radeon HD 7770(1GB)、Radeon HD 7750(1GB)。
而重量級的Radeon HD 7990將在3月12日正式發布,同時發布的還有Radeon HD 7950(1.5GB)、Radeon HD 7850(1GB)版本。最后兩款特殊的產品Radeon HD 7890(1.5GB)和Radeon HD 7790(1GB)分別基于Tahiti LE和Pitcairn LE,流處理器數量得到進一步縮減,上市日期將在2012年第二季度。
● DDM Audio(獨立數字多點音頻):
HD7950的標準接口配置則是一個Dual-Link DVI、一個HDMI、兩個Mini-DP。外觀上是把一個Dual-Link DVI和DP替換成了兩個Mini-DP,實際上是將原來的DL-DVI做成了一路mDP輸出。樣做的好處就是,一片顯卡可以直接接駁任何類型的數字顯示設備而不需要轉接,另外讓三路獨立Audio輸出成為可能。這就是傳說中的DDM audio技術。
上一代顯卡只能同時輸出一路音頻
獨立數字多點音頻(Discrete Digital Multi-Point Audio),簡稱DDM Audio。 以前的GPU只支持單獨一條音頻流,因此在同時使用三臺集成音箱顯示器的時候,只會有一個發聲。
新一代顯卡Radeon HD 7900則是第一款支持多頻音頻流同步獨立輸出的GPU,可以同時輸出三路獨立的數字音頻。每個音箱上都會有聲音,而且可以完全不同,遠程視頻會議一卡搞定!
當然了,DDM Audio技術支持音頻和視頻的綁定和同步切換,所有音頻和視頻都是完全無縫同步的。一部正在播放的視頻從一個顯示端切換到另一個顯示端,音頻信號智能遷移而無需手動更改。
● Eyefinity 2.0(寬域多屏顯示技術):
Eyefinity歷史回顧:
- 2009年9月,Eyefinity驚艷登場,震驚業內。
- 2010年2月:催化劑10.2加入了交火系統對Eyefinity的支持。
- 2010年3月:催化劑10.3支持邊框補償、顯示器單獨色彩調整、多屏分組、改進多屏配置切換。
- 2010年4月:六屏版Radeon HD 5870 Eyefinity 6發布。
- 2010年7月:催化劑10.7,交火系統支持垂直模式的Eyefinity,同時增強HydraVision。
- 2011年4月:催化劑11.4,配置界面改版。
- 2011年5月:催化劑11.5,HydraVision繼續增強。
很顯然,Eyefinity的進步是與催化劑驅動息息相關的,未來也是。
Eyefinity 2.0新特性:催化劑11.10就已經支持的有新的多屏布局配置、彈性的邊框補償、16K×16K超高清分辨率。
催化劑11.12和明年催化劑12.1/12.2將會陸續支持的則有:Eyefinity+HD3D多屏立體技術、自定義分辨率(等待太久了!)、預設管理改進、桌面和任務欄重新定位。
最后一項,之前三屏系統上桌面圖標會停留在第一屏,任務欄則橫跨三個屏幕,看起來很費勁,今后則會全部集中在中央屏幕上,就像單屏那樣。
● HD3D(立體顯示技術):
必須承認,NVIDIA是一家很有遠見的公司,一年多前就研發成功的3D Vision立體顯示技術,現在已經成為整個IT業界的發展趨勢。但AMD的3D立體顯示技術從HD6000開始也獲得了長足的進步,而在HD7000上已經越來越成熟。
首先在硬件方面,只要能夠支持120Hz刷新率的輸出,就可以在PC上實現3D顯示技術。而想要在平板電視和投影儀上實現3D輸出、120Hz刷新率、1080p全高清的3D立體游戲,左右眼各有60Hz,都能達到60FPS的流暢幀率,就需要高帶寬的HDMI 1.4a標準的支持,上一代顯卡中HD6870/6850率先做到了,而HD7000更是不在話下。
DisplayPort 1.2 HBR2、HDMI 1.4a都有超高帶寬,單個接口即可滿足4K×4K分辨率輸出,顯示設備方面的支持不是問題,市面上主流的3D電視、投影儀,還有120Hz LCD或者雙面板LCD都能支持ATI顯卡,尤其是三星和LG都有多款型號早已上市。
支持AMD HD3D立體技術的游戲正在越來越多,現已超過600款,而且可以選擇第三方的iZ3D、DDD或者原生的HD3D等不同方案,其中原生的有:《塵埃3》、《戰地3》、《殺出重圍3:人類革命》、《兩個世界2》。
目前AMD的3D顯示技術,無論效果、兼容性還是軟件支持度方面,都絲毫不差于3D Vision。無論是對于3D游戲的立體化,還是2D視頻的3D化,都得到了主流媒體播放器的支持,而且AMD的新一代UVD3引擎還能支持3D藍光硬解碼,可以說已經相當成熟了。
● AMD APP并行加速技術:
CUDA是NVIDIA顯卡的一大賣點,它能夠將GPU龐大的運算能力釋放出來,對非3D游戲應用軟件進行加速,實現比純CPU運算更快的效能。CUDA目前雖然有很多種類的軟件,但最主要的應用還是集中在視頻編輯和轉碼方面。
Radeon HD 7900系列上的APP加速技術包括三個方面:獨立的硬件高清視頻加速引擎、增強的計算硬件和軟件、基于AMD APP SDK開發包的應用生態系統。
AMD此番帶來了新的高清編碼技術“視頻編碼引擎”(VCE),其核心功能是一個多流硬件H.264高清編碼器,編碼速度甚至超過1080p@60FPS的播放速度,而且支持完全固定、混合計算兩種編碼模式。
質量方面支持4:2:0色彩取樣,針對游戲和視頻場景變化做出優化,并且可以自行控制壓縮質量。此外還支持音頻視頻復合,顯存輸入用于轉碼、視頻會議,GPU顯示引擎輸入用于無線顯示。
TotalMedia Theatre 5.2(簡稱TMT 5.2),特別針對AMD技術優化,支持MVC編碼硬件加速(藍光3D節目)、MPEG-4 ASP UVD硬件加速解碼、基于AMD APP SDK重新編寫的OpenCL SimHD高清差值插件。
TMT 5.2還進行了新概念的重新設計,包括Alpha混合用戶界面、本地與在線媒體管理、電影元數據搜索、DVD電影和視頻片段智能菜單、2D-3D實時轉換插件Sim3D等等。
WinZip 16.5,通過Corel、AMD的合作,針對A卡優化,現在可以利用OpenCL進行Deflate壓縮、Inflate解壓、AES加密的加速,并且能夠同時利用處理器、集成/獨立顯卡的資源。官方宣稱,APU使用集顯或獨顯的測試證明,WinZip 16.5 AES加密的速度提升了兩三倍。
AMD APP生態系統:瀏覽器與插件、消費級視頻編輯、辦公與地圖、流行媒體播放器。
還有新的媒體處理指令SAD(絕對差值和),這是多項關鍵視頻與圖像處理算法的關鍵操作,包括動態監測、姿態識別、食品與圖像搜索、深度提取、計算機視覺等等。
Radeon HD 7900系列支持4×1 SAD、4×4 QSAD,每個時鐘周期可處理最多64個像素,其中Radeon HD 7970每秒鐘能處理18多萬億個像素。此外還有MQSAD,可以忽略背景像素、加速移動物體的隔離。
Steady Video技術也將進化為2.0版本,不過這里AMD只是介紹了基本原理,沒有公開新特性,據說支持QSAD硬件加速、隔行模式視頻、左右對比模式。
AMD演示Demo基于Bullet Physics Library物理加速技術,著名的3DMark 11測試工具的DirectCompute就是基于此技術。另外電影《2012》、《怪物史萊克4》、《游戲總動員3》和《馬達加斯加》等都是用了該技術,通過物理計算實時渲染復雜光照模型以及材質。
高清視頻:
來自一線AIB大廠——訊景,其旗下的一款HD7950產品,訊景作為A卡最為優異優異品牌,多次在業內引領潮流,此次推出的Radeon HD 7950自然也不例外,下面就讓我們一起來看看此款顯卡。
XFX訊景Radeon HD 7950,采用全新GCN架構的Tahiti Pro核心,28nm工藝制程,28個CU單元(總計1792個流處理器),112個紋理單元,支持DirectX 11.1API的圖形顯卡、理論性能相對HD6970提升了30%以上。
供電方面采用采用,公版的7相數字供電設計,全固態電容的用料為穩定性提供了保障。外接供電接口采用6pin+6pin設計,并且支持全新的eroCore Power”(核心零功耗技術),使得待機功耗僅為3W。
顯存方面則配備了12顆GDDR5高速顯存顆粒組成384bit顯存規格。默認核心顯存頻率為900MHz/5500MHz,高于公版的800/5000MHZ,而且此款顯卡的超頻能力不容忽視。
在散熱方面依然采用的是,雙風扇+真空腔均熱板的設計,非公版的外形配合兩只9CM的渦輪風扇,在散熱方面的表現也十分的出眾。
在輸出接口方面,訊景Radeon HD 7950提供了DVI+HDMI+雙Mini Display Port的輸出接口設計,通過轉接頭可滿足大眾用戶的使用需要。其中,HDMI+Display Port雙接口的加入,滿足了用戶組建Eyefinity多屏系統的需要。
同樣來自一線大廠的迪蘭恒進也第一時間為我們帶來了HD7950酷能+版顯卡。
迪蘭酷能+版的Radeon HD 7950,采用全新GCN架構的Tahiti Pro核心,28nm工藝制程,28個CU單元(總計1792個流處理器),112個紋理單元,支持DirectX 11.1API的圖形顯卡、理論性能相對HD6970提升了30%以上
顯存方面則配備了12顆GDDR5高速顯存顆粒組成384bit顯存規格。默認核心顯存頻率為8800MHz/5000MHz,高于公版的800/5000MHZ,而且此款顯卡的超頻能力不容忽視。
在輸出接口方面,迪蘭Radeon HD 7950酷能+提供了DVI+HDMI+雙Mini Display Port的輸出接口設計,通過轉接頭可滿足大眾用戶的使用需要。其中,HDMI+Display Port雙接口的加入,滿足了用戶組建Eyefinity多屏系統的需要。
作為老牌的A卡廠商——鐳風顯卡也第一時間為我們帶來了HD7950毒蜥版顯卡,其完全遵循AMD公版設計,紅黑配色的渦輪風扇彰顯了AMD公版顯卡的高貴品質。
雖說板型為全公版,但是其頻率確實超頻版。鐳風HD7950 龍蜥版顯卡采用最新的28nm制作工藝的HD7950顯示核心,其內部坐擁1792個流處理器,借助GDDR5顯存的5000MHz高頻優勢搭配超頻版900MHz的核心頻率,使其有追趕大哥HD7970的實力。
之前說到了迪蘭,就不得不提藍寶,作為AMD陣營的兩位大哥級廠商之一藍寶為我們帶來了2款HD7950產品。首先我們來看一下地位略低的HD7950白金版顯卡。
我們可以看到,藍寶在HD7950上延續了使用藍色PCB的傳統。藍色的PCB被碩大的但風扇散熱器所覆蓋。給人一種很沉穩的感覺。
規格方面,其核心頻率為810MHZ,略高公版的800MHZ,搭載了3GB的5000MHZ的GDDR5顯存,12顆顆粒組成384bit的位寬。
在輸出接口方面,藍寶Radeon HD 7950白金版提供了DVI+HDMI+雙Mini Display Port的輸出接口設計,通過轉接頭可滿足大眾用戶的使用需要。其中,HDMI+Display Port雙接口的加入,滿足了用戶組建Eyefinity多屏系統的需要。
接下來的時間該輪到藍寶的HD7950至尊版了,該卡的外形很對得起其至尊的稱號,碩大的雙鳳扇,密集的鰭片以及粗壯的熱管均彰顯了高端的風采。
HD7950至尊版的核心頻率達到了900MHZ,超過公版800MHZ一大截,顯存為公版的5000MHZ,相信其性能較公版有較大提升。
在輸出接口方面,藍寶Radeon HD 7950至尊版提供了DVI+HDMI+雙Mini Display Port的輸出接口設計,通過轉接頭可滿足大眾用戶的使用需要。其中,HDMI+Display Port雙接口的加入,滿足了用戶組建Eyefinity多屏系統的需要。
老牌板卡大廠——微星也為我們帶來了其R7950顯卡,包裝沿用了微星之前的風格,包裝上印著AfterBurner的標志,意識著該卡可以通過AfterBurner軟件(原RivaTuner,已被微星收購)跨越AMD驅動限制去挑戰極限頻率。
HD7950至尊版的核心頻率達到了830MHZ,超過公版30MHZ,顯存為公版的5000MHZ,相信其性能較公版略有提升。而且Tahiti Pro核心的極限也不止于此,還有很大超頻空間。
在輸出接口方面,微星R7950提供了DVI+HDMI+雙Mini Display Port的輸出接口設計,通過轉接頭可滿足大眾用戶的使用需要。其中,HDMI+Display Port雙接口的加入,滿足了用戶組建Eyefinity多屏系統的需要。
作為AMD的核心合作伙伴當中的純A卡的AIB廠商屈指可數,全球只有HIS、迪蘭(撼訊)、藍寶三個廠商。早已進入國內市場的迪蘭和藍寶已經具備很成熟的市場占有率,而HIS是唯一一直沒有染指國內市場的AIB廠商。

不過這種局面從今天開始已經改變!我們今天得到消息,大名鼎鼎的HIS借本次AMD發布HD7950的時機,正式進軍國內市場,在國內發布了一款型號為HIS 7950 Fan 3GB GDDR5的顯卡!如今世界三大A卡品牌齊齊亮相。三國鼎立的局面即將形成,一場大戲即將到來。
● 測試模式與測試方法:
此次發布的顯卡定位高端游戲玩家,性能十分強勁,測試時所有游戲中開啟全部特效,包4X抗鋸齒(AA)和16X各向異性過濾(AF)。雖然很多游戲提供了更高精度的AA,但由于實用價值不高,且沒有可對比性,所以不做測試。
為了做到全面客觀,有對比和參考,分辨率測目前最主流的1920x1080,和更高階的2560x1600。目前也有部分顯示器是(1920x1200),游戲在這種分辨率下的性能表現與1920x1080差不多,FPS稍低一點點,使用這種顯示器的朋友依然可以參考我們的測試成績。
● 測試平臺配置:
此次測試平臺選擇了Intel最高端的六核心處理器,搭配最新的X79芯片組,與Radeon HD7950系列強強聯手,定位次旗艦顯卡之戰。
測試平臺實物照
AMD此次發布的新品HD7950,我們自然會拿它與自家上代產品HD6970和HD6990進行對比。至于N卡方面,則選擇了單芯最強的GTX580進行對比,同時奉上HD7950超頻的成績,總計六款顯卡項目測試。
除了OC項目外,其他參測顯卡都使用NVIDIA和AMD雙方的公版規格和公版頻率,這樣測得的性能和功耗發熱數據最有參考價值。
軟件介紹:做為目前最為權威的性能測試軟件,3DMark Vantage在3D基準性能測試,可以全面準確的得出顯卡的真實性能,所以在歷次測試中都少不了它的加盟。3DMark Vantage所使用的全新引擎在DX10特效方面和《孤島危機》不相上下,但3DMark不是游戲,它不用考慮場景運行流暢度的問題,因此Vantage在特效的使用方面比Crysis更加大膽,“濫用”各種消耗資源的特效導致Vantage對顯卡的要求空前高漲。
畫面設置:3DMark Vantage中直接內置了四種模式,分別為Extreme(旗艦級)、High(高端級)、Performance(性能級)和Entry(入門級),只有在這四種模式下才能跑出總分,如果自定義模式就只能得到子項目分數了。我們此次測試選擇了Extreme(旗艦級)進行測試。
● 3DMark Vantage Extreme模式成績:
3DMark Vantage 是目前驗證顯卡DX10性能較好的工具,不過由于其采用了PhysX物理加速技術,導致N卡總分偏高。因此N卡在此測試項目中的排名,相比3Dmark11中有所提升。
Crysis(孤島危機)無疑是DX11出現之前對電腦配置要求最高的PC游戲大作。作為DX10游戲的標桿,Crysis的畫面達到了當前PC系統所能承受的極限,超越了次世代平臺和之前所有的PC游戲。Crysis還有個資料片Warhead,使用了相同的引擎。


畫面設置:Crysis只有在最高的VeryHigh模式下才是DX10效果,但此前所有高端顯卡都只能在低分辨率下才敢開啟DX10模式,如今的DX11顯卡終于有能力單卡特效全開流暢運行。為了讓不同用戶都能找到參考的成績,我們測試了1920X1080和256X1600兩種分辨率4AA兩種模式。
測試方法:Crysis內置了CPU和GPU兩個測試程序,我們使用GPU測試程序,這個程序會自動切換地圖內的全島風景,我們跑兩遍得到穩定的平均FPS值。
● 1920X1080分辨率性能測試
● 2560X1600分辨率性能測試 雖然顯卡已經更新換代數次,但《孤島危機》仍然是目前的殺手級游戲。在1080P分辨率下開啟4倍抗鋸齒HD7950還是可以流暢運行,但是到了2560X1600的怪獸級分辨率,其性能就略顯不足。游戲介紹:自《孤島驚魂》系列的版權被UBI購買之后,該公司蒙特利爾分部就已經開始著手開發新作,本作不但開發工作從Crytek轉交給UBI,而且游戲的故事背景也與前作毫無關系,游戲的圖形和物理引擎由UBI方面完全重新制作。
畫面設置:借助于蒙特利爾工作室開發的全新引擎,游戲中將表現出即時的天氣與空氣效果,所有物體也都因為全新的物理引擎,而顯得更加真實。你甚至可以在游戲中看到一處火焰逐漸蔓延,從而將整個草場燒光!而且首次對DX10.1提供支持,雖然我們很難看到。
測試方法:游戲自帶Benchmark工具。
● 1920X1080分辨率性能測試
● 2560X1600分辨率性能測試
所有參測顯卡表示《孤島驚魂2》毫無壓力,看來用其作為測試游戲是個失誤。
時至今日,依然沒有任何一個測試軟件或者游戲能夠取代3DMark在游戲玩家心目中的地位。但是到了《3DMark11》,因為A/N顯卡測測試成績和游戲成績有不小出入,質疑之聲四起。


3DMark11的測試重點是實時利用DX11 API更新和渲染復雜的游戲世界,通過六個不同測試環節得到一個綜合評分,藉此評判一套PC系統的基準性能水平。
● 3DMark 11的特色與亮點:
1、原生支持DirectX 11:基于原生DX11引擎,全面使用DX11 API的所有新特性,包括曲面細分、計算著色器、多線程。
2、原生支持64bit,保留32bit:原生64位編譯程序,獨立的32位、64位可執行文件,并支持兼容模式。
3、全新測試場景:總計六個測試場景,包括四個圖形測試(其實是兩個場景)、一個物理測試、一個綜合測試,全面衡量GPU、CPU性能。
4、拋棄PhysX,使用Bullet物理引擎:拋棄封閉的NVIDIA PhysX而改用開源的Bullet專業物理庫,支持碰撞檢測、剛體、軟體,根據ZLib授權協議而免費使用。
● 3DMark 11 Extreme模式成績:在3DMark 11之前推出的Heaven Benchmark和StoneGaint這兩款DX11測試軟件都片面注重于Tessellation性能,以致于遭到了AMD和部分游戲玩家的不滿。而3DMark11則提供了多種負載的測試場景,更加均衡的考驗了顯卡的DX11性能,因此其測試結果將更具代表性一些。
賽車游戲中,轟鳴的發動機聲、風馳電掣的急速快感,足以讓無數玩家腎上腺素飆升。也許正是如此,才使得《科林麥克雷:塵埃3》在眾多游戲中備受玩家青睞。
《塵埃3》采用與《F1 2010》同樣的Ego引擎,擁有更加擬真的天氣系統及畫面效果。游戲將包含冰雪場景、動態天氣、YouTube上傳、經典的賽車、分屏對戰、party模式、開放世界、更多真實世界中的贊助商和車手等特點。
相比首款DX11游戲的《塵埃2》,《塵埃3》在諸多DX11游戲特效的力助下,游戲畫質表現更加出色。無論是日出還是日落,下雨還是干燥,看上去都非常逼真。背景的煙花和觀眾讓游戲代入感非常強。車身會隨著比賽的進行染上泥土或者雪,一輛嶄新的賽車或許會在比賽完成之后,變成一輛被泥土覆蓋的“垃圾車”。
圖像方面,《塵埃3》是該系列至今為止最漂亮的一款。《塵埃3》中的駕駛感相當不錯,6種調整選項也足以應付各種地形。而且,在芬蘭、密歇根、挪威、洛杉磯、肯尼亞和摩納哥駕駛賽車狂飆真的是一種享受。賽車會對相當細微的操作做出回應,在雪地或泥地中,這一點尤其重要。而當你的對手把雪花和泥漿彈到你的擋風玻璃上時,你只能依靠自己的直覺和細微的操作不至于翻車。而游戲中,雪花、雨滴和夜晚駕駛不僅僅是外在的裝飾而已,和現實生活一樣,你需要各種賽車配件來應對這些情況。
● 1920X1080分辨率性能測試
● 2560X1600分辨率性能測試

在A卡御用游戲《塵埃3》中,HD7950被GTX580擊敗,但是差距微乎其微,預計下一版本驅動將會帶來更強勁的性能。
由EA DICE工作室開發的《戰地3》采用了最新的“寒霜2”引擎,完美支持DirectX 11,并且擁有強大的物理效果,最大的亮點還是光照系統,其渲染的場景已近乎亂真的地步,視覺效果堪稱絕贊。游戲還支持即時晝夜系統,為玩家營造一個親臨現場的真實環境。

寒霜2引擎最大的特點便是支持大規模的破壞效果。由于考慮到游戲的畫面表現以及開發成本,DICE放棄了以只支持DX9的WINDOWS XP操作系統。另外由于該引擎基于DX11研發,向下兼容DX10,因而游戲只能運行于WINDOWS VISTA以上的的操作系統。
在《戰地3》中,“寒霜引擎2”內置的破壞系統已經被提升至3.0版本,對于本作中的一些高層建筑來說,新版的破壞系統將發揮出電影《2012》那般的災難效果,突如其來的建筑倒塌將震撼每一位玩家的眼球。
《戰地3》采用了ANT引擎制作人物的動作效果。在此之前,ANT引擎已在EA Sports旗下的《FIFA》等游戲中得到應用,不過在FPS游戲中使用尚屬首次。相較于Havok等物理引擎,用ANT引擎可以花費較少的精力制作出逼真的效果。舉例來說,戰士在下蹲時會先低頭俯身、放低槍口,而不是像以前的游戲那樣頭、身、槍如木偶般同時發生位移。此外,ANT引擎也可以讓電腦AI的行動更加合理。但這款大作目前并不能良好的兼容120Hz3D以及紅藍3D模式。
● 1920X1080分辨率性能測試
● 2560X1600分辨率性能測試

《戰地3》中HD7950以微弱優勢領先GTX580。HD6970不出意外的墊底兒。
AVP原始版本并不支持AA,但升級至1.1版本之后,MSAA選項出現在了DX11增強特效當中,當然還支持Tessellation、HDAO、DirectCompute等DX11招牌特效,游戲畫面相當出色。
游戲介紹:《Aliens vs. Predator》同時登陸PC、X360和PS3,其中PC版因為支持DX11里的細分曲面(Tessellation)、高清環境光遮蔽(HDAO)、計算著色器后期處理、真實陰影等技術而備受關注,是AMD大力推行的游戲之一,但是這樣的主題難免讓本作有很多不和諧的地方,暴力血腥場面必然不會少!發行商世嘉在2009年11月就曾明志,表示不會為了通過審查而放棄電子娛樂產品發行商的責任,因為游戲要維持“異形大戰鐵血戰士”這一中心主題,無論畫面、玩法還是故事線都不能偏離原著。
測試方法:游戲帶Benchmark,其中測試畫面頗代表意義,很好的體現了Tessellation異形身體以及HDAO等高級特效,希望這些特效能讓系統發揮所有潛力。
● 1920X1080分辨率性能測試
● 2560X1600分辨率性能測試
《Aliens vs. Predator》是首批支持DX11的游戲之一,但相比前面的《塵埃2》加入了更多DX11特效,對顯卡性能有一定的要求。因此當測試畫面中出現了N個異型以后,HD6970有些吃不消,其他顯卡則表示壓力不大。
游戲介紹:《地鐵2033》(Metro 2033)是俄羅斯工作室4A Games開發的一款新作,也是DX11游戲的新成員。該游戲的核心引擎是號稱自主全新研發的4A Engine,支持當今幾乎所有畫質技術,比如高分辨率紋理、GPU PhysX物理加速、硬件曲面細分、形態學抗鋸齒(MLAA)、并行計算景深、屏幕環境光遮蔽(SSAO)、次表面散射、視差貼圖、物體動態模糊等等。
開啟景深,模擬鏡頭感
畫面設置:《地鐵2033》雖然支持PhysX,但對CPU軟件加速支持的也很好,因此使用A卡玩游戲時并不會因PhysX效果而拖累性能。該游戲由于加入了太多的尖端技術導致要求非常BT,以至于我們都不敢開啟抗鋸齒進行測試,只是將游戲內置的效果調至最高。游戲自帶Benchmark,這段畫戰斗場景并不是很宏大,但已經讓高端顯卡不堪重負了。
測試說明:如果說是CRYSIS發動了DX10時代的顯卡危機,那地鐵2033無疑是DX11時代的顯卡殺手!地鐵2033幾乎支持當時可以采用的所有新技術,在畫面雕琢上大肆鋪張,全然不顧顯卡們的感受,和CRYSIS如出一轍。然而CRYSIS靠著特效的堆積和不錯的優化,其驚艷絕倫的畫面和DX9C游戲拉開了距離,終究賺足了眼球;而地鐵則沒有這么好運了,畫面固然不差,BUG卻是很多,招來了大量的非議。
● 1920X1080分辨率性能測試
● 2560X1600分辨率性能測試
特效的濫用,超大的紋理和復雜的模型,也許4A Games本來就沒打算讓這款游戲流行。本次測試我們使用4AA抗鋸齒+全特效來考驗顯卡,現在高端顯卡玩地鐵2033終于像是一款游戲而不是幻燈片或者別的什么了,而HD7900系列則讓我們看到了一線曙光。
《孤島危機2》是《孤島危機》的續作,游戲采CryENGINE 3引擎所制作。在游戲內容上與一代也有很大變化,已經從秘密的叢林作戰轉向了公開、大規模的現城市戰爭。故事發生在距一代3年后的2023年。外星人在地球上的大片區域挑起了戰爭,各大城市都遭到攻擊,人口銳減,玩家將要進行捍衛地球的末日戰爭。
CE3擁有不遜于CE2的畫面表現,并且帶來了諸多的新特性和強大的SandBox3編輯器,同時新引擎也能適應目前的PS3/XBOX360家用機平臺,帶來家用機上的高水準發揮,同時代表作Crysis2將登陸PC/XBOX360/PS3平臺,引擎支持DirectX9/DirectX10/DirectX11,DX11版本僅PC,且要下載補丁。由于是一款NVIDIA的THE WAY游戲,所以此游戲DX11版本優化了N卡。
● 1920X1080分辨率性能測試
● 2560X1600分辨率性能測試
《孤島危機2》中AMD一血前恥,默認頻率下的HD7950也能略微領先GTX580,超頻之后更是將其遠遠甩在身后。
在另一款標桿性DX11游戲《Stone Giant》中,通過曲面細分+置換貼圖達到了的畫質提升同樣非常顯著,整個場景的細節程度獲得大幅加強,讓畫面更加逼真。
游戲介紹:游戲引擎開發商BitSquid與游戲開發商Fatshark近日聯合公布了一個展示DX11強大技術的DEMO。這個名為《StoneGiant》(石巨人)的DEMO,可以讓玩家來測試自己PC顯卡的DX11性能。BitSquid Tech即將提供PC平臺的引擎,并且大概在今年第三季度將提供PS3和Xbox 360等其他平臺的引擎。
置換貼圖由于需要大量的頂點去進行位移,所以需要模型具備足夠數量的多邊形,而曲面細分做的事情也正是如此,這也就成為了它提升畫面質量的第二重作用。
畫面設置:StoneGiant是一款重量級的DX11測試軟件,之所以這么說是因為它大量使用了DX11的招牌特效:曲面細分和景深特效,可以讓顯卡的DX11性能表露無遺。進入之后可以選擇開啟關閉Tessellation以及DOF(DX11級別景深)進行測試,這兩項技術都十分消耗資源,尤其是同時打開時。其中Tessellation技術對畫質的改善最為明顯,測試時默認開啟Tessellation、打開DOF進行測試。
● 1920X1080分辨率性能測試
● 2560X1600分辨率性能測試
石巨人是另一款DX11性能測試軟件,在之前測試中,A卡的“壓力”依然很大,DX11特效使用的越多,其表現就越差,因為HD5000/6000中均只有一個曲面細分單元。HD7950在這個測試項目中惜敗GTX580。
Tessellation如此重要,所以首款DX11測試程序——Heaven Benchmark中,幾乎所有的場景都是由Tessellation技術動態生成的,地圖中央的飛龍,和周圍凹凸不平的磚墻、石階和瓦片給人留下了深刻的印象。
Unigine Engine率先發布了首款DX11測試/演示程序——Heaven Benchmark,其中大量運用了DX11新增的技術和指令,在DMark11面世之前,Heaven曾經是DX11性能測試的非常好的選擇。
Heaven Benchmark 1.0和2.5的Tessellation細分程度對比
在這幅圖中,大家注意觀察左側的墻壁(以及凸出石塊的陰影)、右側的臺階和下方的鵝卵石路,Tessellation技術生成的是實實在在的頂點和曲面,所有的巖石、臺階和石塊都是獨立存在,而不再是平面上的虛擬貼圖而已。
畫面設置:2.5版本進一步強化了Tessellation技術的應用,細分精度更高,畫面更上一層樓。
● 1920X1080分辨率性能測試
● 2560X1600分辨率性能測試
Extreme模式的Tesselation實際上卻沒有多少實際意義,因為加重曲面細分級別并沒有帶來顯著的畫質改善,卻大大加重了顯卡的負擔,FPS損失非常慘重。此項測試只能片面的證明顯卡的Tesselation性能,并不能代表顯卡在實際DX11游戲中的表現。
在經歷了兩年前阿卡姆瘋人院帶來的震撼后,Rocksteady終于在今年年底帶來了蝙蝠俠的續作——阿卡姆之城。這款游戲也在上市之初讓我們見識出了正統版權的威力,有華納兄弟的贊助與發行,完全再現電影和小說中的原著橋段不再是夢,100%的高還原度讓玩家猶如身臨其境,再現了一個熒幕上真實的蝙蝠俠或許也是這部游戲的成功所在。
《蝙蝠俠:阿卡姆之城》仍然建立在《阿卡姆瘋人院》的氣氛上,不過這次上升至阿甘之城——高譚市內戒備森嚴的,關押了大量暴徒的監獄之中。而且新作還匯集了眾多明星參與的配音陣容以及蝙蝠俠中的極度兇殘的惡棍,并改進和加強了一游戲特點,讓玩家們擁有像《蝙蝠俠前傳2:黑暗騎士》一般的終極游戲體驗。
阿卡姆之城的畫面,絕對是當今次時代游戲中數一數二的,但是其開發引擎卻依舊是虛幻3,這著實讓許多玩家感嘆,到底虛幻3引擎還有多大潛力可以發揮。雖然虛幻3引擎目前來看最大的問題就是畫面普遍油膩感十足,但是在阿卡姆之城中,少許的油膩感卻成了點睛之筆,讓蝙蝠俠更加貼近漫畫、電影。
除了虛幻3的引擎外,蝙蝠俠從上一代作品中就加入了NVIDIA的PhysX物理加速引擎。在游戲的細節中,更加貼近真實效果,煙霧、燈光、人物的衣服、報紙等等細節全部通過PhysX物理引擎計算,游戲中的破碎、打擊效果隨之表現的也不在那么匪夷所思。但是,凡事都有兩面,真實的受力表現換來的則是大量的資源占用,這也使得蝙蝠俠這個虛幻3引擎的游戲一下成為了硬件殺手,如果達到非常好的游戲表現,恐怕非GTX580這樣的旗艦單卡莫屬了。
● 1920X1080分辨率、PhysX high性能測試
● 1920X1080分辨率、PhysX off性能測試
● 2560X1600分辨率、PhysX high性能測試
● 2560X1600分辨率、PhysX off性能測試
通過測試成績我們發現在PhysX游戲中使用CPU強行開啟PhysX特效顯然不如N卡使用顯卡加速來得快,不過幸好支持PhyX的游戲大作不是很多。
第六章/第四節
● 《文明5》紋理壓縮
得益于全新的GCN架構,圖形計算性能相對VLIM5和VLIW5提升非常大,在《文明5》紋理壓縮對比中性能領先Radeon HD 6970多達49%,對比GeForce GTX 580也領先了1%。
● SmallLuxGPU光線追蹤
在SmallLuxGPU光線追蹤測試下,Radeon HD 7950表現更加驚人,對比Radeon HD 6970、GeForce GTX 580分別高出69%、68%,僅比Radeon HD 6990慢了11%。
第六章/第五節
● DX11 SDK CS流體模擬
由于網格搜索測試基于CUDA而開發,NVIDIA顯卡占有絕對的優勢,即使是Radeon HD 7950相對Radeon HD 6970提升了40%,依然和GTX 580有不小的差距。
● 蒙特卡羅算法
蒙特卡羅算法基于OpenCL,測試結果為模擬400步執行所需的時間。這是Radeon HD 5000系列以來A卡的長項,Radeon HD 7950又進一步比Radeon HD 6970提升了11%,明顯領先。Radeon HD 6900系列其實還要比Radeon HD 5800系列稍慢一些,可能是VLIW4架構的緣故。● AES加/解密
在AES加/解密表現中,Radeon HD 7950雖然相對上代Radeon HD 6970領先65%,不過依然不敵GTX 580。
總體來說采用了GCN架構的Radeon HD 7950,在很多通用計算性能方面實現了質的飛躍,只是在一些NVIDIA優勢項目上依然落敗GTX 580,總體表現相當出色。
● 3DMark Vantage 像素紋理填充

測試中使用3DMark Vantage來測量像素填充,通過利用ROP單元盡量混合更多的像素。理論上Tahiti Pro可以在每個時鐘周期完成32個色彩的處理,也就是說800MHz的Radeon HD 7950可以獲得25.6Gpix/s的速率,不過任何架構并不是100%執行的,實際測試中Radeon HD 7950像素填充率為11.89Gpix/s。
如果按照理論計算(參照Radeon HD 7950),那么Radeon HD 6970為28.16Gpix/s,不過實際中Radeon HD 7950卻領先Radeon HD 6970多達39%。雖然ROP的執行效率離100%差距甚遠,不過相對Radeon HD 6970執行效率提升非常大,這大概也是AMD不在Tahiti上面繼續增加ROP的目的吧!
<
我們的功耗測試方法是直接統計整套平臺的總功耗,既簡單、又直觀。測試儀器為微型電力監測儀,它通過實時監控輸入電源的電壓和電流計算出當前的功率,這樣得到的數值就是包括CPU、主板、內存、硬盤、顯卡、電源以及線路損耗在內的主機總功率(不包括顯示器)。
待機為windows7桌面下獲得的最小值;滿載是以1440X768模式運行Furmark時的最大值,Furmark能夠讓顯卡穩定的以100%滿負載模式運行,測得的功耗值比一般的游戲要高一些。
● 顯卡空閑整機功耗測試(顯示器除外)
● 顯卡滿載整機功耗測試(顯示器除外)
HD7950待機功耗僅98W,遠小于HD6990和GTX580,基本和集顯功耗相當,可見AMD在空閑功耗控制方面有了突破性的技術進步。
滿載功耗方面,HD7950控制的也是非常出色,即使超頻以后性能飆升,功耗依然低于GTX580,表現非常完美。

AMD新君HD7950對比NVIDIA卡皇GTX580完全是壓倒性的性能優勢,在大部分游戲中都保持較大的領先幅度,而在2560大分辨率的考驗下,擁有3GB顯存的HD7950優勢更加明顯,就算加權N卡優勢項目,平均值依然領先GTX580!只在兩款Tessellation Benchmark、PhysX游戲中及個別游戲告負。
可能有些人會說,HD7950無論核心頻率還是顯存頻率,都要比GTX580高不少,這樣對比會否有失公允?如果您有這個疑慮的話,那么不妨看看表格最下方的功耗測試,無論是待機功耗還是滿載功耗,HD7950比GTX580都要低一些。
這就意味著,A卡無論單位功耗下的性能、還是顯卡整體性能,都已經勝勝過目前的高端N卡了。

上一代的AMD單芯卡皇HD6970無論規格還是架構,都無法和HD7970相提并論,因此性能表現也難以同日而語,HD7950整體性能領先HD6970 27.58%。
而且仔細看來,HD6970能跑出這個成績也屬僥幸了,主要是在一些對CPU要求很高的物理游戲或者對顯卡要求相對低的游戲中,FPS達到極限,CPU成為瓶頸。否則會輸的更慘!
總體來看,長江后浪推前浪,HD7950完全秒殺上一代的HD6970!雖然因為規格的大幅提升,滿載功耗上升而來11.86%,但能耗比依然是大幅提升。當然這里并不是說HD6970廢柴一條!HD7950價格定位本身也高出HD6970不少,HD6870依然有自己的用戶定位和市場空間。

遁世修行的HD6990雙芯高人出馬果然名不虛傳,終于重挫HD7950的銳氣。整體來看,HD6990相比HD7950優勢還是比較明顯的,除去BatMan2以外,平均領先27.79%。
但是為何要除去BatMan2?因為在BatMan2測試時,驅動和游戲版本并沒有最完善版本,雙芯并沒有發揮作用,反而拖累了性能表現。如果加入BatMan2的成績,HD6990領先幅度將大打折扣。
既然明知有Bug,為何還要放上成績?小編這里其實想借機告訴想多GPU集聯的朋友,近年來雙芯顯卡抑或雙卡CF雖然效率出眾,性能爆表,但并非完美。并不是所有游戲的不同版本都能兼容。存在即為合理,我們測試就不得不考慮到這種情況而加以說明。

默認頻率下的HD7950完敗于HD7970在我們的預料之中,畢竟HD7950的頻率及規格與旗艦級產品HD7970有一定的差距。但是總體差距并不是特別巨大,除了功耗和《蝙蝠俠2》外,平均相差了14.14%。

HD7950作為AMD定位次高端的顯卡,默認頻率高達800/5000MHz。但28nm的工藝極限并不在此。和此前顯卡測試不同,前面所有的效能測試中我們均特意加入了1000/6300MHz的成績,原因有三:
1、Radeon HD7950 超頻之后,性能表現非常穩定,在所有測試項目中均無花屏死機或者驅動停止響應的情況發生。
2、Radeon HD7950 超頻1000/6300MHz,并不需要更改核心和顯存電壓,而功耗增加也非常少,基本可以忽略。
3、Radeon HD7950 超頻至1000/6300MHz,相對于默認頻率功耗增加非常小,基本可以忽略。
很顯然GTX580已經不是HD7950的對手,因此我們不應該停留在單純對比性能與價格這種初級階段了,在本文的最后,我們來回顧和總結一下HD7950的幾大特點。
● 非常先進的28nm工藝
GPU的制造是一項極為復雜的過程,GPU制造工藝的先進與否決定了GPU的性能優劣。事實上GPU的發展史也可以看作是制作工藝的發展史。更先進的制造工藝意味著更高的集成度,更高的性能。說制作工藝的改進是GPU發展帶來最強大的源動力亦不為過。
● 最高的能源效率
工藝和架構的革新讓Radeon HD7950擁有更低的能源利用效率,而這也是首次旗艦顯卡擁有個位數的待機功耗。
● 最快的PCI-E速度
PCI-E 3.0規范將數據傳輸率提升到8GHz|8GT/s(最初也預想過10GHz),并保持了對PCI-E 2.x/1.x的向下兼容,繼續支持2.5GHz、5GHz信號機制。基于此,PCI-E 3.0架構單信道(x1)單向帶寬即可接近1GB/s,十六信道(x16)雙向帶寬更是可達32GB/s。
● 最新的DirectX API支持
Radeon HD7970系列是第一款支持Microsoft DirectX 11.1的顯卡,新版API支持的諸多新特性是未來Win8中各項應用保持領先的前提。HD7950繼承了HD7970這些特性。
● 更好的應用體驗
在應用體驗方面,南方群島在上一代北方群島的基礎上更上層樓。更加先進的Eyefinity2.0和HD3D技術無疑讓A卡用戶有了更高端的視覺享受機會。
AMD曾經背負效率低下罵名的SIMD架構,在HD6000終于笑到了最后。憑借超大規模的流處理器、以及改進的雙超線程分配處理器,HD6000的效率比起HD5000有了明顯的提升。如果繼續優化擴充的老路,28nm工藝、43億個晶體管的HD7000性能飆升也是可以預期的。
反觀NVIDIA架構想要擴充流處理器的話,需要耗費更多的晶體管,由此導致NVIDIA的GPU核心面積要比AMD同級別產品大不少,而大核心除了成本較高之外,還得面對良品率較低、功耗較大的負面影響。既然如此,為何AMD還要進行大規模的架構革新?
隨著技術的發展,圖形和計算的概念已經不再像以往分的那么清楚了,進入DX11時代時候,全新API新特性賦予GPU更多的任務和使命。“通用計算”這一專業術語越來越多的現于新聞、見諸報端。AMD作為全球領先的GPU制造廠商,為高性能計算做出了巨大的貢獻,而這次AMD下定決定進行大規模的架構革新很大程度上也是為了這方面做出的考慮。
AMD能夠在架構革新的同時,進一步降低功耗與發熱,還能提升性能、增強功能實在難能可貴,而各方面都非常優秀的HD7950無疑讓下一代NVIDIA高性能級的顯卡壓力增加不少!而2012顯卡市場注定不會寂寞!
●HD7950的意義
作為生力軍的HD7000系列顯卡,在今年能有多大作為我們還不得而知,主要還是看NVIDIA能拿出什么產品來抗衡AMD的GCN架構。但是就目前的格局來看顯卡市場的主動權已經由AMD所掌握。因此AMD也不傻,不會用HD7970屈身和GTX580廝殺,那樣會降低HD7970的地位,因此這也是HD7950出世的一個重要理由。
HD7950的性能在默認頻率下比GTX580強得不是很多,但是得益于28nm制程以及優秀的核心效率,通過簡單的超頻即可將GTX580打得滿地找牙,在超頻到1GHZ/6300MHZ的時候甚至將大哥HD7970超越。預計首批HD7950上市之后價格會在3000元到3500元之間,等大量鋪貨后有很大幾率降到3000元以下的售價。屆時NVIDIA壓力將會很大,期待AMD RADEON HD7950的市場表現,更期待NVIDIA為我們帶來HD7970的死敵。■<
關注我們


