28nm新卡皇!Radeon HD 7970全面評測
泡泡網顯卡頻道12月23日 北京昨天中午1點,AMD正式全球發布了新一代南方群島,首批型號包括Radeon HD 7970和Radeon HD 7950兩款產品,產品全面進化到28nm,采用了全新的GCN(Graphics Core Next)架構。
南方群島旗艦系列Radeon HD 7970顯卡采用了全新的28nm工藝,晶體管數量一躍43億,新的GCN架構也是專為圖形計算而設計的架構,384Bit顯存位寬的引入一改256Bit當道的局面,帶寬輕松達到200GB/s。
相對于PCI-E 2.0,PCI-E 3.0提升一倍,PCI-E x16可以實現高達32GB/s的傳輸帶寬,目前Intel X79以及明年即將發布的Ivy Bridge也將實現對其的支持。Radeon HD 7970成為全球首款支持PCI-Express 3.0顯卡,同時也率先支持DirectX 11.1,相對于現有的DirectX 11更進一步。
由于運輸的問題,目前中國大陸還沒有收到AMD的送測樣卡,產品正式送測要等到1月9日產品同步上市,本文編譯自anandtech的測試。
更多Radeon HD 7970官方規格介紹和性能參數請參考:
產品布局方面AMD依然走了先高端后低端的路線,首批旗艦級芯片Tahiti將演化為Tahiti XT的Radeon HD 7970和Tahiti PRO的Radeon HD 7950顯卡。
而在次一級AMD還將推出Pitcairn、Cape Verde兩款GPU,其中Pitcairn將會生成Radeon HD 7870和Radeon HD 7850兩款產品,成為中高端領域的主力,而Cape Verde對應的Radeon HD 7770和Radeon HD 7750兩款產品作為南方群島的中流砥柱,將成為市場主流明星產品。
規格方面Radeon HD 7970采用了Tahiti XT GPU,擁有2048個流處理器,128個紋理單元和32個光柵單元,默認核心頻率為925MHz,相對上代的Radeon HD 6970的880MHz更進一步。
顯存方面并沒有使用傳說中的XDR2顯存,繼續使用了GDDR5顯存,顯存頻率為5500MHz,和Radeon HD 6970保持一致,而為了滿足顯卡計算帶寬的需要,Radeon HD 7970將成熟依舊的256Bit顯存控制器依然拋棄了,新的384Bit顯存控制器,使得帶寬提升了50%,可以很好的滿足數據傳輸的需求。
不得不說的在定價方面,AMD前衛了一次,549美元的定價以及國內4699元人民幣的定價,刷新了今年來單GPU上市的記錄,當然作為旗艦產品,Radeon HD 7970不會以走量來布局,選購的用戶僅限于極限發燒用戶。
雖然晶體管數量一躍到43.1億,相對于Radeon HD 6970的26.4億提升了63%,不過由于采用了全新的TSMC 28nm工藝,核心面積并沒有出現增長,相反還出現了些許的下降。
而在功耗控制方面,一方面由于采用了全新的28nm工藝,另外AMD還引入了ZeroCore Power技術,待機功耗低至3W,創造了性能級顯卡待機功耗的新紀錄,而在本文后續的測試中可以得到完整的體現。
另外AMD還將ZeroCore Power技術引入到了多顯卡CrossFire當中,系統平臺中在非極限負載模式下,將會關閉其中的一些顯卡,僅保留一款顯卡工作,滿足性能需求的同時,功耗也得到了急劇的下降。
而在超頻方面,借助VISION Engine控制中心,1GHz能夠輕松實現,風冷下最大化超頻更是可以達到核心1.35GHz的好成績,同時顯存6500MHz也能夠很輕易的實現。
除了引入全新的GCN架構,南方群島也帶來了新的AMD Eyefinity 2.0技術和AMD App Acceleration技術,將多屏擴展和應用程序加速更好的滿足用戶的使用需求。
新的AMD Eyefinity 2.0技術全面支持DisplayPort 1.2標準和HDMI 1.4a標準,同時還加入了Color Correction顏色校正技術,而多屏擴展方面還引入了多組音視頻流技術,只需一塊顯卡就可以實現多路視頻語音會話。
另外相對于Eyefinity技術,新的Eyefinity 2.0可以擴展高達16K*16K分辨率顯示輸出,能夠擁有更大的顯示視野。
同時為了滿足多屏擴展用戶隨心定制桌面的要求,新的Eyefinity 2.0允許用戶定義主顯示桌面的排列位置,不再單一的居左顯示,增強了多屏擴展的可玩性。
APP加速方面,最早起源于高清硬件解碼,隨后擴展到各種應用程序,提高用戶使用體驗,全新設計的Video Codec Engine(VCE)視頻編碼引擎,擴展了UVD的通用性,同時支持音視頻實時混合和無線顯示技術。
UVD高清視頻解碼方面,新的YUVD擴展支持MVC(Multi-View Codec)和MPEG-4/Divx格式視頻解碼,同時在原雙流(HD+SD)視頻的基礎上支持雙流(HD+HD)視頻解碼。
新的QSAD能夠提供10倍速率的圖像增強處理,同時新的Steady Video 2.0能夠更好的加速和處理抖動的視頻。
應用程序加速擴展了對瀏覽器、視頻處理等主流應用的支持,包括Microsoft IE、FireFox、Chrome、Adobe Flash Player、Silverlight、Microsoft PowerPoint、Google Earth等。
點擊可查看高清大圖
點擊可查看高清大圖
Tahiti GPU
測試平臺選擇了Intel新一代Sandy Bridge-E,CPU自然是Intel Core i7-3960,為了避免CPU的瓶頸,將CPU超頻至4.3GHz,主板選取了EVGA X79 SLI,內存為G.Skill Ripjaws DDR3-1866 4 x 4GB組合,內存時序為8-10-9-26。
對比測試的顯卡包括Radeon HD 3870、 Radeon HD 4870、 Radeon HD 5850、Radeon HD 5870、Radeon HD 6950、Radeon HD 6970、Radeon HD 6990,而NVIDIA陣營方面包括GeForce 8800GT、GeForce GTX 285、GeForce GTX 470、GeForce GTX 570、GeForce GTX 580、GeForce GTX 590。
系統選擇Windows 7 Ultimate 64-bit,NVIDIA驅動選擇了最新發布的ForceWare 290.36 Beta,而AMD顯卡方面則選擇了Catalyst Beta 8.921.2-111215a。
● 孤島危機:彈頭
《孤島危機:彈頭》是由德國Crytek Studios開發,美國藝電(EA)發行的一部孤島危機正統續作。玩家將在游戲中繼續借助Nanosuit與外星種族展開最后的生死搏斗,與眾多新增角色一同進行驚心動魄的冒險之旅。此作將全面強化Nanosuit作戰服的嶄新能力與操作體驗,新加入的“Advanced AI”技術將把游戲互動體驗提升到一個史無前列的巔峰高度。
不得不說硬件發展到現在,《孤島危機:彈頭》依然是單GPU顯卡的殺手,整個測試分為六個對比部分,畫質分為2560*1600、1920*1200和1680*1050,在1680*1050分辨率下幾乎所有的主流顯卡都可以流暢的運行游戲,此時Radeon HD 7970的成績為86.7,領先GeForce GTX 580 13.9FPS。
隨著游戲分辨率的提升在2560*1600分辨率下,Radeon HD 7970成為唯一一款能夠流暢運行《孤島危機:彈頭》的單GPU顯卡,游戲最小幀速為23.5FPS。
● 地鐵2033
《地鐵2033》描述了西元2033年,由于核戰爆發,整個世界都籠罩在輻射之下,人類幾乎死盡。僅存的人類躲藏在莫斯科的地鐵站里掙扎求生,布滿輻射塵的地表已為各種變種生物所占據,地底的列車站臺成了人們最后的聚集地。人類的生存空間在那些日益增多的變種生物的威脅下一天天縮小,人類幾乎絕跡。
故事的主角阿爾喬姆是核爆后出生的生存者,他的興趣是收集戰前的風景明信片,夢想地表的模樣;某日,一起突如其來的事件迫使阿爾喬姆踏上旅途,前往其他的站臺求援,以拯救自己居住的地鐵站以及最后人類的命運……
一個掌握著人類命運的青年即將踏上未知的冒險之旅,尋找擁有拯救人類的力量的英雄。
測試成績和《孤島危機:彈頭》相似,在最高分辨率下,Radeon HD 7970再次突破30FPS,達到36FPS,成為首款單GPU流暢運行《地鐵2033》的顯卡。
● 塵埃3
作為經典越野賽車系列新作,Codemasters聲稱《塵埃3》要打造“有史以來最大型的拉力賽游戲”,《塵埃3》采用與《F1 2010》同樣的Ego引擎,擁有更加擬真的天氣系統及畫面效果。
游戲將包含冰雪場景、動態天氣、YouTube上傳、經典的賽車、分屏對戰、party模式、開放世界、更多真實世界中的贊助商和車手等特點。
在全新的生涯模式,強調了團隊合作的元素,玩家可以以專業賽車手的身份開始新的生涯模式參加充滿挑戰性的越野賽道。除了傳統的拉力賽以外,游戲還提供挑戰賽,該模式中限制了車輛的控制,使比賽更需要技巧。融合眾多現代和經典賽車,所有的賽車模型會比以往的作品更加細致。《塵埃3》包含從挪威的阿斯彭到蒙特卡羅到非洲平原的超過100條賽道。屆時將會讓玩家體驗到一款全新的賽車盛宴。
《塵埃3》整個測試過程中相對比較平穩,在1680*1050分辨率下,Radeon HD 7970表現并不出色,不過隨著游戲分辨率的提升,在極致2560*1600分辨率下轉敗為勝,再一次成為單GPU王者。
● 全面戰爭:幕府將軍2
《全面戰爭:幕府將軍2》游戲時代設定在十五世紀的日本戰國時代,這個時候的日本被眾多大名把持著,各大名之間為了爭奪土地和日本的統治權,互相討伐不斷,這給游戲提供了充分的素材,游戲中。你的任務就是扮演一名戰國時代的大名,培植親信,建立軍隊,通過外交、經濟、暗殺等手段,逐步達到你的目的——作為勝利條件,你的目的有四個:消滅你的敵對家族;讓你的家族存活七十年;占領日本四十個藩國;統一日本。
在1680*1050和1920*1200分辨率下,Radeon HD 7970一如流暢的運行整個游戲,不過在分辨率調整到2560*1600分辨率時,意外發生了,Radeon HD 7970幀速瞬間下降到28.2FPS,僅能勉強流暢運行游戲,而GTX 580幀速更是低至21.8FPS已經嚴重制約了游戲的流暢運行。
● 蝙蝠俠:阿甘之城
《蝙蝠俠:阿甘之城》仍然建立在《阿甘瘋人院》的氣氛上,不過這次上升至阿甘之城——高譚市內戒 備森嚴的,關押了大量暴徒的監獄之中。而且新作還匯集了眾多明星參與的配音陣容以及蝙蝠俠中的極度兇殘的惡棍,并改進和加強了一游戲特點,讓玩家們擁有像《蝙蝠俠前傳2:黑暗騎士》一般的終極游戲體驗。
《蝙蝠俠:阿甘之城》是剛剛登陸北美的另一游戲新作,對硬件要求較高,特別是在2560*1600分辨率下,很多顯卡都不能夠流暢運行游戲,GTX 580和Radeon HD 7970不再淘汰之列,而Radeon HD 7970再一次以18%的優勢領先GTX 580。
● 傳送門2
《傳送門2》是一款以Source引擎制作的FPS游戲,為經典第一人稱解密游戲《傳送門》的續作。續作中添加多種道具以及全新的環境,劇情緊接一代游戲。
傳送門,是對門的廣義延伸,這個門連接的不在是里外的空間,而是連接整個3維乃至多維空間。通過傳送門,可以將人或物瞬間傳送到特定或指定的地點或空間,是一種及其快捷的傳輸工具。但由于許多技術問題,現在的傳送門還只是個概念,只能在電影、動畫及游戲中實現。
《傳送門2》這款游戲相對來說對顯卡要求較低,所以省去了1680*1050分辨率的測試環節,另外測試分別使用了兩種抗鋸齒模式MSAA(多重取樣抗鋸齒模式)和SSAA(超級取樣抗鋸齒模式)。
多重取樣抗鋸齒模式測試環境下,游戲可玩性非常高,即使8800GT這種古老的顯卡也能在1920*1200分辨率下流暢運行游戲,不過改用超級取樣抗鋸齒模式后,所有顯卡測試成績都急劇下滑,在2560*1600分辨率下,Radeon HD 6950也只能勉強流暢運行游戲,而此時Radeon HD 7970以44.9繼續擔當單卡王,不過與GTX 480的差距縮小到3.8FPS,領先優勢不是十分明顯,二者接口流暢運行。
● 戰地3
《戰地3》是一款由EA DICE工作室(EA Digital Illusions CE)開發制作、EA(美國藝電)出版發行的第一人稱射擊游戲。游戲使用寒霜2引擎,不支持Windows Vista以下的操作系統。《戰地3》是《戰地2》的正統續作,是EA《戰地》系列的第十一部。PC版多人模式支持高達64人網絡對戰,主機版則最大支持24人。
《戰地3》這款號稱硬件殺手的游戲并沒有給Radeon HD 7970帶來什么壓力,2560*1600分辨率下,Radeon HD 7970依然高達49.7FPS,而此時的GTX 480成績為44FPS,領先幅度約13%。
● 星際爭霸2
《星際爭霸2》是由暴雪在2010年7月27日推出的一款RTS即時戰略類游戲,作為《星際爭霸》的續篇講述了人族、星靈和異蟲三族的故事。《星際爭霸Ⅱ》將以三部曲的形式推出,即Wings of Liberty、Heart of the Swarm和Legacy of the Void。
暴雪《星際爭霸2》對于Radeon HD 7970依然比較多余,2560*1600、1920*1200和1680*1050分辨率Radeon HD 7970一致保持10FPS+的成績領先GTX 580,穩坐單GPU王座。
● 文明5
由Firaxis開發的《文明5》將會帶來一個全新的戰斗系統、更深層次的外交互動,一系列的新特性可以讓玩家沉浸在建立自己的王國并征服世界的喜悅中。
可能對玩家來說最大的驚喜在于《文明》提供了更深入的策略、更真實的游戲體驗和逼真的游戲環境。游戲使用的是一個全新的引擎,能夠使玩家最大程度地感受到《文明》系列游戲的魅力。外交系統將全屏展現,伴隨有領導者的動畫和適當的語言。那些不喜歡和談的玩家們也會發現直接發動戰爭的快感更加強烈。
《文明5》也會包括MOD和多人游戲元素,游戲中設置了一個社區中心,玩家們可以在此交流經驗或是進行切磋。
《文明5》繼續充當了使者的角色,并沒有給Radeon HD 7970帶來多大的壓力,在2560*1600分辨率下,Radeon HD 7970平均幀率達到了56.6FPS,而此時的GTX 580為50.3FPS,領先幅度為12.5%。
● 《文明5》紋理壓縮
得益于全新的GCN架構,圖形計算性能相對VLIM5和VLIW5提升非常大,在《文明5》紋理壓縮對比中性能領先Radeon HD 6970多達58%,對比GeForce GTX 580也領先了12%。
● SmallLuxGPU光線追蹤
在SmallLuxGPU光線追蹤測試下,Radeon HD 7970表現更加驚人,對比Radeon HD 6970、GeForce GTX 580分別高出74%、72.5%,即使相比于雙芯的GeForce GTX 590也領先了4%,僅比Radeon HD 6990慢了9%。
● DX11 SDK CS流體模擬
由于網格搜索測試基于CUDA而開發,NVIDIA顯卡占有絕對的優勢,即使是Radeon HD 7970相對Radeon HD 6970提升了47%,依然和GTX 580有不小的差距,成績僅和GTX 570相當。
● 蒙特卡羅算法
蒙特卡羅算法基于OpenCL,測試結果為模擬400步執行所需的時間。這是Radeon HD 500系列以來A卡的長項,Radeon HD 7970又進一步比Radeon HD 6970提升了14%,明顯領先。Radeon HD 6900系列其實還要比Radeon HD 5800系列稍慢一些,可能是VLIW4架構的緣故。
● AES加/解密
在AES加/解密表現中,Radeon HD 7970雖然相對上代Radeon HD 6970領先71%,不過依然不敵GTX 580,甚至還惜敗給GTX 570,而值得注意的是在改用了PCI-E 3.0之后成績得到了顯著提升,由324ms減少為297ms。
總體來說采用了GCN架構的Radeon HD 7970,在很多通用計算性能方面實現了質的飛躍,只是在一些NVIDIA優勢項目上依然落敗GTX 580,總體表現相當出色。
作為DirectX 11的重點革新,曲面細分(Tessellation)和紋理填充極大的改善了圖形質量,新的GCN架構在優化了執行效率,雖然ROP并沒有得到增多,不過理論的測試卻真實的反映了性能的顯著提升。
測試中使用3DMark Vantage來測量像素填充,通過利用ROP單元盡量混合更多的像素。理論上Tahiti XT可以在每個時鐘周期完成32個色彩的處理,也就是說925MHz的Radeon HD 7970可以獲得29.6Gpix/s的速率,不過任何架構并不是100%執行的,實際測試中Radeon HD 7970像素填充率為13.33Gpix/s。
如果按照理論計算(參照Radeon HD 7970),那么Radeon HD 6970為28.16Gpix/s,不過實際中Radeon HD 7970卻領先Radeon HD 6970多大51%。雖然ROP的執行效率離100%差距甚遠,不過相對Radeon HD 6970執行效率提升非常大,這大概也是AMD不在Tahiti XT上面繼續增加ROP的目的吧!
而在曲面細分(DirectX 11 Detail Tessellation Sample)方面,Radeon HD 7970一躍成為NO.1,每秒處理速度達到了255.FPS,領先GTX 580的2523FPS,而相對于Radeon HD 6970提升非常明顯,領先達233FPS,特別是在Max模式下更是領先57%。
曲面細分第二部分測試選取了Unigine Heaven,主要反映理論成績和實際成績的對比,不過這款引擎依然沒有被DirectX 11游戲使用。可以看到Radeon HD 7970相對Radeon HD 6970再次大幅提升,幅度達56%,另外GTX 580也被拉下馬,成績達到了63.5FPS,僅落后于雙芯的GTX 590和Radeon HD 6990。
待機情況下,Radeon HD 7970整個平臺僅為113W,遠低于GTX 580的133W,成為所有測試顯卡中待機功耗最低的產品。
借助ZeroCore Power技術,在系統長期被閑置后,系統功耗進一步降低,功耗下降到103W,又減少了10W,看來ZeroCore Power技術所言非虛,對于高性能顯卡用戶來說長時間待機可以節約不少的電,畢竟很多時候顯卡幾乎處于零工作狀態。
滿載測試環境下,選用了《地鐵2033》作為整體平臺負載測試,實際測試中Radeon HD 7970平臺功耗為391W,和GTX 570幾乎持平,比GTX 580低出了34W,不過相對Radeon HD 6970還是有所提升。
而在使用OCCT考級測試下,相對Furmark可以真實的反映出顯卡的最大功耗,實際測試中,Radeon HD 7970平臺為357W,同樣比Radeon HD 6970高出了不少,不過比GTX 580的451W低了近100W。
總體來說采用28nm工藝的Radeon HD 7970雖然功耗相比Radeon HD 6970有一定的提升,不過相對GTX 580/GTX 570等重量級顯卡來說依然屬于節能型選手,另外ZeroCore Power技術帶來的低至3W的待機功耗非同凡響,表現非常驚人,性能和低功耗得到了完美的平衡。
溫度測試中,采用了28nm工藝的Radeon HD 7970繼續表現出色,待機核心溫度低至34℃,比Radeon HD 6970的36℃低了2℃。成為參測顯卡中待機溫度最低的產品。
同樣平臺滿載測試選擇了《地鐵2033》,測試中Radeon HD 7970和Radeon HD 6950相當,都為74℃,低于Radeon HD 5850的68℃,成為溫度第二低的產品,而GTX 580的溫度整整高出了10℃,達到了84℃。
接下來同樣適用OCCT對顯卡進行滿載測試,測試中Radeon HD 7970升溫至79℃,依然表現出色,而此時的GTX 580更是直逼90大關,為88℃。
靜音和低溫對于性能及顯卡向來成反比的,隨著顯卡TDP的膨脹,水冷逐漸步入高端顯卡行列,測試中Radeon HD 7970待機為40.2dB,僅比Radeon HD 3870高出一些,不過整體來說這些顯卡都表現相當,GTX 580也只有41dB。
進入《地鐵2033》熔爐后,這些乖巧的孩子沒有再老實了,Radeon HD 7970一躍達到了55.2dB,成為僅此于GTX 590的噪音殺手了,而此時GTX 580相對平和一些為52.1dB。
最后一項OCCT的顯卡考級測試中,Radeon HD 7970噪音繼續攀升達到了57.3dB,不過此時Radeon HD 7970的定位發生戲劇性的變化,原因是GTX 580限制顯卡TDP的做法被暴露無遺,一舉超越了Radeon HD 790,達到了59.3dB。
在測完所以的項目后,Radeon HD 7970相信已經感動了大部分的讀者,作為一款28nm的先驅,再采用GCN架構后,相對Radeon HD 6970發生了質的飛躍。
● 游戲
Radeon HD 7970作為一款高端顯卡,旨在為游戲而設計,產品最重要的是速度有多快以及成本,很顯然性能上Radeon HD 7970作為王者做到了。
而在價格方面,自2008年,AMD就成為價格殺手,屢屢將對手顯卡拉下馬,不過這次AMD出乎意料的將新品定位到549美元(中國定價4699元人民幣)成為近幾年顯卡價格的新高度。
從測試成績上看,Radeon HD 7970已經完全能夠勝任高達2560*1600分辨率的游戲運行,這也是目前為止首款單GPU能夠達到此要求的顯卡,另外AMD官方宣稱的CrossFire性能直逼100%提升也非常值得期待。
雖然從整體性能上看Radeon HD 7970于雙芯GTX 590或Radeon HD 6990還有一定的差距,不過雙卡帶來的高功耗和發熱以及利用率相信不是每個用戶能夠接受的,選擇單芯性能王者依然是大部分的用戶選擇。
● 計算
隨著并行計算的退管,顯卡被用到越來越多的通用計算上面,而專為通用計算設計的GCN也認準了這一趨勢,這是自R600架構以來的一次重大變革,此前一直是修修補補。
而從本次的實際測試來看,GCN以絕對優勢領先VLIW5、VLIW4架構,也正證實了GCN的正確性,而GCN不僅僅是HPC(高性能計算),它也是AMD融合的一部分,相信時間會告訴我們真相!■ <
關注我們



