紅色帝國的激進美學!ATI先進技術解讀
天涯上有一篇訪問量過百萬的帖子,不知道大家看過沒有,標題叫做“尋找男人的世界一:落日余暉——追憶紅色帝國的暴力美學”,講得是前蘇聯設計的一些令強大的美帝也聞風喪膽或自嘆不如的恐怖玩意,有成功的也有失敗的,但無一不是經典之作,比如:米格25超高音速戰(zhàn)斗機、赫魯曉夫超級氫彈、N1霸王登月火箭、臺風級核潛艇等等。
軍事是男人的世界,硬件同樣是男人的世界,筆者每天都在與硬件打交道,看完此貼后突發(fā)奇想,感覺這個“紅色帝國的暴力美學”用在ATI身上是最合適不過了,ATI雖然已被AMD收購,ATI顯卡雖然在市場占有率方面處于弱勢地位,但其顯卡的設計風格以及對技術執(zhí)著的追求卻絲毫沒有改變。ATI帶給我們的經典和驚喜一樣多,很多產品和技術都讓強大的NVIDIA頭痛不已,令以圖形技術領袖自居的NVIDIA馬不停蹄的追趕……
ATI顯卡雖然談不上暴力,但也足夠激進了,因此本文就斗膽套用天涯精華貼的標題,列出十項近年來ATI顯卡的經典設計和技術,每一項都足以讓對手汗顏,最終不得不跟進,從而推動了GPU圖形技術的發(fā)展,并帶給用戶更完美的顯卡。
為讓評測文章更具參考價值,同時也讓廣大網友能夠看到自己最感興趣的內容,泡泡網DIY評測室特意開設了“You Think.I do”板塊,您可以將最感興趣的內容、甚至任何想法發(fā)送到郵箱“Think@PCPOP.COM”,我們會有針對性地挑選網友關注的熱點進行評測,一旦您的建議被采納,在評測文章發(fā)布之日我們會為您送出精美禮物一份!
往日經典文章回顧:
一、ATI顯卡先進技術回顧:GPU工藝的領頭羊/新制程開路先鋒
為了讓GPU擁有更強的性能和更多的功能,就必須在核心中植入更多的晶體管,而大規(guī)模晶體管的代價就是無可避免的功耗和發(fā)熱,為了解決功耗發(fā)熱問題,使用更精密的工藝是最好的出路。
ATI一直以來都是新工藝的領頭羊,相對于競爭對手而言,幾乎就是全面的壓倒性優(yōu)勢,始終令對手戴著保守與落后的帽子。遠的就不提了,就從DX10芯片開始說起吧:
● DX10第一代:RV630/RV610率先使用65nm

R600(80nm)核心面積432mm2,G80(90nm)核心面積496mm2

RV630(65nm)核心面積148mm2,G84(80nm)核心面積160mm2
ATI首顆DX10圖形核心R600就使用了80nm工藝,而保守的NVIDIA在G80上還是使用過時90nm工藝。先不論性能誰勝誰負,在工藝上就慢了半拍。就在NVIDIA主流型號G84/G86都提升到80nm的時候,ATI對應的RV630/RV610等一系列產品都已經走入了65nm的行列。
● DX10第二代:RV670/RV635率先使用55nm
當NVIDIA一再抨擊工藝不重要,唯性能論時,自己也在暗度陳倉,悄悄的在G98核心上低調的試水65nm工藝,而后終于在中高端主力G92核心上大規(guī)模使用65nm工藝。NVIDIA本以為在工藝上終于可以與ATI齊頭并進的時候,ATI最新的RV670已經開始投產,這次的高端芯片甚至跳過了65nm而直接步入了55nm的新高度,時至如今,ATI全新的RV790核心依舊走在55nm的前列。
● DX10第三代:RV740率先使用40nm,GPU工藝首次超越CPU

40nm的RV740新品為ATI將要推出的RV870芯片充當開路先鋒
今年上半年,基本上兩大圖形芯片都在55nm工藝的道路上前行著,不過NVIDIA的55nm工藝來得較慢一些,最早是逐步通過原有的65nm G92核心升級到55nm G92b一路過來的,之后的高端產品GT200也是漸漸的升級到55nm,到如今NVIDIA才剛剛把全部陣營統(tǒng)一到55nm行列,整整慢了一年。不過,這時的ATI最新推出的RV740又震懾了我們一把,再次將現有新品工藝提升到40nm,意義不僅是在圖形芯片上超越了對手,也是首度超越了CPU 45nm的工藝。
● NVIDIA和ATI將全線使用40nm工藝
當然,NVIDIA在工藝方面“追逐”的腳步也在不斷加快,據最新的報道顯示,NVIDIA剛剛正式發(fā)布的五款GeForce 200M系列筆記本顯卡全部使用了臺積電最新的40nm工藝,而且NVIDIA發(fā)言人自豪的聲稱:“我們使用了臺積電40nm生產能力的80%左右”。看來,NVIDIA臺式顯卡全面普及40nm也指日可待了。
ATI一次又一次的在工藝方面上演傳奇,不得不令對手緊跟其后,這也為GPU的發(fā)展起到了推波助瀾的作用,不斷的日新月異。新工藝帶來的優(yōu)點不言而喻,更高頻的頻率意味著更強的性能,更小的核心意味著更低的功耗發(fā)熱與成本,也給廣大用戶帶來更優(yōu)秀的產品。
二、ATI顯卡先進技術回顧:GPU顯存的領頭羊/GDDR4/5先驅者
除了工藝上的領先外,ATI顯卡在其顯存的規(guī)格上,也是高人一等的,一直以來,對手NVIDIA幾年如一日般始終沿用著GDDR3顯存,而1.0ns的主流規(guī)格也只有2000MHz的頻率,即便最快的0.8ns GDDR3上限也就是2400MHz。
● 夭折GDDR4顯存:X1950XTX、HD2600XT、HD3870
提到ATI的GDDR4顯存,可以追溯到4年前的Radeon X1950XTX產品,那是首款采用0.9ns的GDDR4顯存的顯卡(當時最快的DDR3是1.2ns),之后HD2600XT、HD3870也使用了GDDR4顯存,不過由于性能的關系和顆粒廠商的投放,GDDR4并沒有發(fā)展起來,這也是NVIDIA為什么一直沿用GDDR3的一個重要原因,盡管ATI率先吃了第一個螃蟹,但是味道并不怎么樣,不過其敢于嘗試的精神還是值得推崇的。

2年前ATI首款GDDR4顯存的顯卡就是這個0.9ns的三星顆粒
GDDR4沒落的原因:同為0.8ns的GDDR3和GDDR4,雖然GDDR4容易達到更高頻率,但是由于延遲的增加,實際性能甚至比GDDR3還要差,因此GDDR4被冷落也在情理之中。最終由于內存芯片廠商沒有投入精力研發(fā)改良GDDR4,其規(guī)格也就止步于0.8/0.7ns,甚至0.6ns都沒有放在產品上,僅僅只有樣品而已,相比GDDR3沒有質的提升。
另有一說,JEDEC組織中GDDR4標準的制定者就是ATI的高層,NVIDIA自然全力抵制GDDR4,加之GDDR4相比GDDR3沒有質的提升,而且成本又高,最終不了了之。
● GDDR5威力驚人:256Bit HD4870挑落448Bit GTX260

HD4870首次使用GDDR5顯存,256bit將對手448bit挑落馬下
雖然面對之前的GDDR4無疾而終,絲毫沒有阻擋住ATI前進的步伐,新一輪的顯存爭奪上,又是ATI捷足先登,HD4870率先采用GDDR5顯存顆粒,緊接著是4870X2,在保持256Bit顯存位寬不變的情況下,大幅提升了顯存頻率,默認頻率高達3600MHz,消除了困擾多年的帶寬瓶頸,成為了目前規(guī)格不凡的顯卡產品。
● GDDR5平易近人:128Bit HD4770完勝256bit 9600GT戰(zhàn)平9800GT

定位中端的HD4770上面也使用了GDDR5顯存,128bit對抗256Bit成為可能
也正是因為GDDR5顯存的助陣,HD4870才能以較小的核心、較低的顯存位寬(256Bit),來挑戰(zhàn)NVIDIA恐怖的GTX200核心(512Bit),而且雙核的HD4870X2也迫使NVIDIA不得不拿兩顆怪獸GTX200來對抗。雖然最終在性能方面依然是N卡占優(yōu),但在產品設計及成本方面,NVIDIA已經意識到了不足并開始重新審視GDDR5的威力。
● NVIDIA終于全面搭上GDDR5快車
據傳聞,NVIDIA將在下代GT300芯片上使用GDDR5顯存,不過最新消息,其筆記本GPU芯片已經開始升級到GDDR5顯存并搭配40nm工藝,看來NVIDIA也有些按耐不住了。不過這一切相對于ATI來講,都是玩過的東西了,也許你會說ATI一直在這方面比較激進,但這就是科技發(fā)展的動力,保守固然可靠,但是失去敢于挑戰(zhàn)的勇氣,就不會有進步。
三、ATI顯卡先進技術回顧:公版率先使用數字供電/做工出色
ATI顯卡最為AFan津津樂道的莫過于其豪華的用料和出色的做工,奢侈的數字供電系統(tǒng)更是曾經ATI顯卡的獨有標志。追溯到過去的X1800時代,到現在的HD4000,每一次ATi近乎瘋狂的在高端原廠卡上面“不惜工本”采用豪華數字供電,事實上這種供電是很冗余的,用不好的話說就是浪費,但ATI原廠卡設計師都是追求完美的,他們?yōu)閺V大AFan們獻上了一件件藝術品:
● 從X1000開始全面進入數字時代:

從左到右依次為:X1900XTX、X1800XT、X1800XL
(豪華的7/6/5相數字供電)
從之前的X1000系列開始,ATI就與豪華的數字供電結下了不解之緣,當時1950PRO采用特別訂做的雙路并聯磁閉貼片式電桿,每個都能通過40A的大電流(比很多顯卡整卡需要的電流還高),也就是說這個小家伙總共能通過80A的電流。不要小看這種并聯電感,它最高可以在2MHz頻率下工作,屬于超高頻電感了,而且體積小,全球能設計并制造這種電感的廠商沒幾家,再加上是定制產品,所以價格高昂,甚至比很多顯卡整個電源部分的成本還高。
● HD2900XT空前豪華的陣容:

到ATI RV600身上,我們看到了更為驚人的數字供電體系,更猛的7相
到了HD2900XT這代,供電部分相比當年的X1900XTX更加豪華,電子元件排列非常整齊。右上角的VT1165MF搭配6顆VT1195SF(此芯片已包含MOS在內)以及兩顆并聯電感組成6相電源給R600核心供電。而左邊的另一顆VT1165MF主控芯片僅控制1顆VT1195SF和電感單獨給顯存供電。相比對手傳統(tǒng)的供電方式,先不論供電性能如何,光憑豪華的尺度,ATI在供電方面就有足夠驕傲本錢。
● HD3870X2/HD4870X2/HD4870/HD4890,數字供電不斷升華

HD3870X2=(2+1)x2 HD4870X2=(3+1)x2
● GTX280/260/295,曇花一現的N卡數字供電

GTX280是NVIDIA最豪華的數字供電方案,然而只是曇花一現
反觀對手NVIDIA,在公版卡設計方面一直都本著夠用就好的實用主義原則,換句不好聽的話說就是節(jié)約成本。一代又一代的產品相比較,在做工用料方面,ATI絕對是技高一籌。盡管GTX280顯卡告訴我們數字供電不是ATI的專利,N卡的用料做工也能做到極致奢華,但其供電設計始終缺乏美感,凌亂的布局根本無法同ATI原廠卡相提并論,這也就是雙方在設計理念方面的差異。

很遺憾NVIDIA最新的單核旗艦卡GTX285又拋棄了豪華數字供電系統(tǒng)
可是GTX280畢竟是曇花一現,最新的GTX280升級版GTX285由于功耗下降不少,NVIDIA認為數字供電太浪費了,加之成本方面的考慮,GTX285的供電系統(tǒng)相對于GTX280來說開始大幅縮水,雖然仍可以用豪華來形容,但少了數字供電怎么也稱不上奢華,這一點相比ATI來說,有些不厚道。
除了GTX280外,NVIDIA有兩款顯卡被逼無奈使用了數字供電,那就是雙核心雙PCB的9800GX2和GTX295,因為鏤空設計的PCB可用空間實在是太小,也只有集成度超高的數字供電才能在如此狹小的空間內滿足龐大核心和顯存的需求。
在GTX295改用單PCB設計之后,NVIDIA又放棄了數字供電,看來NV的理念還是夠用就好,從不輕易使用成本高昂的數字供電系統(tǒng),除非是逼不得已——GTX280功耗太大,而9800GX2和GTX295的PCB空間極其有限。
● 綠色陣營AIC也鐘愛數字供電
由于數字供電成本很高的原因,只有ATI高端公版卡才會使用,而AIB合作伙伴一般都會放棄數字供電,使用傳統(tǒng)供電重新設計高性價比的非公版顯卡。但在NVIDIA陣營卻正好相反,AIC合作伙伴近年來對數字供電產生了濃厚的興趣,而且“出手闊綽”,這與“小器鬼”NVIDIA公版產生了鮮明對比:

華碩GTX295火星版,使用了迄今為止最強大數字供電(5+1)x2

影馳GTX275,核心供電部分使用了數字供電,但顯存還是傳統(tǒng)供電
雖然羊毛出在羊身上,數字供電和傳統(tǒng)供電到底相差多大,也不容易測試,但單憑數字供電的昂貴價格,我們總該相信一分錢一分貨的道理。與競爭對手NVIDIA不同,ATI追求的是板卡的完美,而不是低成本,這可能是兩者設計風格不同造成的,但我們不可否認ATI在優(yōu)異產品上的先進供電技術確實是值得推崇的。
四、ATI顯卡先進技術回顧:單PCB雙核顯卡的設計方案
兩大圖形廠商,為了霸占性能王者的寶座,一直想方設法的提升產品的性能,在目前有限的工藝下,只有像CPU一樣,朝著多核發(fā)展,才是提升性能的有利手段,因此雙芯顯卡就應運而生了。

NVIDIA的雙核顯卡一直采用雙PCB設計:7900GX2和7950GX2

NVIDIA的雙核顯卡一直采用雙PCB設計:9800GX2和GTX295
一直以來NVIDIA和AMD-ATI在雙核心顯卡上就走著截然不同的道路。NVIDIA主張雙PCB雙芯設計,認為雙PCB結構布線寬松不少,PCB層數要求低,但是成本及散熱是弊病,而且結構越復雜越容易出問題,基本無法使用第三方散熱器(除非是專門定做的)。

ATI一直采用單PCB雙芯設計:HD3870X2和HD4870X2
而ATI無論是自己的公版還是旗下AIB自行研發(fā)的雙核心顯卡全部是清一色的單PCB雙芯結構。但單PCB雙芯對于供電和布線的要求較為苛刻,布線緊密、PCB層多、集成度超高。
就此,到底雙PCB雙芯好,還是單PCB雙芯好的問題,不僅是當時NVIDIA與ATI相競爭的手段,也成為發(fā)燒玩家之間一個爭議不斷的話題。究竟哪種設計技術更好更先進,自己說永遠沒有說服力,只有對手承認好才是真的好,看了NVIDIA最新的雙芯產品,相信我們心里也會有答案的。

最新的升級版NVIDIA GTX295顯卡拋棄雙PCB采用類似ATI的單PCB設計
最終,一直主張雙PCB雙芯的NVIDIA終于低下了高貴的頭,低調的推出了單PCB雙核心的新版GTX295。不能說誰模仿了誰,但與ATI設計有著異曲同工之妙,可以認為變相肯定了對手的設計理念,因此說ATI具有先進的、完美的單PCB雙核顯卡的設計方案,相信不足為過。
五、ATI顯卡先進技術回顧:率先引入筆記本PowerPlay節(jié)能技術
說道先進技術,ATI的PowerPlay節(jié)能就不得不提,自AMD收購ATI之后,對于顯卡的功耗發(fā)熱問題投入了足夠多的重視,發(fā)布RV670核心時就把筆記本顯卡專用的PowerPlay節(jié)能技術引入到臺式機GPU身上,PowerPlay不但可以自動降低GPU頻率,而且可以在顯卡空閑時降低電壓,讓部分晶體管處于深度休眠狀態(tài),從而最大限度降低GPU的發(fā)熱和功耗。

在一些老游戲或者網游中,強大的GPU無需全速運行,從而節(jié)省大量功耗

vista系統(tǒng)可以識別出RV670支持PowerPlay節(jié)能技術
現在GPU的晶體管、核心面積、功耗和發(fā)熱量早已超過了CPU,可是一直以來顯卡的功耗和發(fā)熱問題都沒能得到重視,即便您不玩游戲,顯卡還是要白白的浪費很多電力、制造一些煩人的噪音、并且源源不斷地發(fā)出廢熱!
通過實際測試來看,PowerPlay除了能夠在GPU空閑和高清視頻播放時降低功耗發(fā)熱之外,還能夠在運行一些負載不高的老游戲時,智能的降低顯卡頻率、并適當的降低GPU使用率,從而達到節(jié)能、降低發(fā)熱、控制噪音(溫控風扇自動降速)的目的。
● NVIDIA也有節(jié)能技術,但僅限高端卡
當年AMD率先在K8 CPU上實現筆記本才有的CnQ節(jié)能技術,之后Intel迅速跟進,也將SpeedStep節(jié)能技術引入桌面。而ATI率先在桌面GPU上引入PowerPlay技術后,NVIDIA的反應就有些冷淡了,直到GTX280發(fā)布時才加以支持,而且還沒有一個正式名稱,因為中低端顯卡都不支持。
NVIDIA的風格是不肯輕易低頭,雖然PowerPlay是項好技術,但不能盲目跟風,否則就有失領袖風范。與ATI全線顯卡統(tǒng)統(tǒng)支持PowerPlay技術不同,NVIDIA只有GTX200系列高端卡才能支持節(jié)能技術,近期推出的一些綠色節(jié)能版9600GT和GTS250也能支持,那為什么這么低調呢?因為還有一大批型號不支持,如果過于強調節(jié)能的優(yōu)勢,誰還買老卡?
六、ATI顯卡先進技術回顧:超越對手支持微軟DX10.1/SM4.1
ATI RV670是首款支持DX10.1和SM4.1的GPU,根據微軟的說法,DX10.1是對DX10的一系列完善、補充、拓展和延伸,并增加5個新的API、支持即將發(fā)布的最新硬件、強制要求FP32紋理過濾和4x MSAA多重采樣反鋸齒。ATI HD3000/HD4000全系列顯卡都支持DX10.1。

一些游戲對于不支持DX10.1的NVIDIA顯卡來說,性能大幅下滑
之前通過對一系列DX10.1游戲的測試,以及針對DX10.1游戲所做得AMD顯卡與nVIDIA顯卡的對比測試我們可以很明顯的看到DX10.1相對DX10來說不僅僅是在游戲畫質上有一定程度的提高,同時它對游戲速度的提升也是顯而易見的,特別是AA效能十分明顯。
● 被“和諧”的DX10.1游戲——《刺客信條》
遺憾的是,支持DX10.1的游戲還是太少了,屈指可數,根本無法與NVIDIA的專利——PhysX游戲相提并論,這也使得ATI的DX10.1技術備受冷落。至于個中緣由只可意會不可言傳,通過首款DX10.1游戲《刺客信條》被和諧事件可以略知一二。

之前的測試,原版《刺客信條》DX10.1模式下,4xAA性能提升18.69%。
事件回顧:《刺客信條》發(fā)布時,原版默認支持DX10.1,但育碧很快就放出了一個升級補丁,偷偷的去掉了對DX10.1的支持,致使A卡性能下降不少。
● NVIDIA再次低頭?40nm新核心全部支持DX10.1
NVIDIA始終認為DX10.1不是必須,因為DX10.1所帶來的新特性實在是太少,NVIDIA擁有強大的驅動研發(fā)團隊,通過改進驅動算法也能讓DX10顯卡“兼容”DX10.1的新技術和新特效。據之前的報道來看,NVIDIA聲稱DX10.1只是過渡規(guī)格,打算跳過DX10.1直接進入DX11時代。

DX10.1游戲屈指可數,只能說ATI的影響力遠不如NVIDIA
就在前幾天,NVIDIA正式發(fā)布了五款GeForce 200M系列筆記本顯卡,不但在NVIDIA史上首次全部采用40nm新工藝,并開始配備GDDR5顯存,還加入了對DX10.1的支持。此前雖再度有相關傳聞,但就在DX11迫近之際,NVIDIA竟然真的接納了長期“恨之入骨”的DX10.1這一技術,實在讓人難以捉摸,NVIDIA也尚未對此做出正面解釋。
終于沒有人再提“DX10.1無用論”了,ATI微笑著堅持到了最后。但DX11也快來了,AMD已經在臺北電腦展上拿出了DX11的GPU和Demo,并且信誓旦旦的稱AMD將率先推出DX11顯卡。現在,DX10.1不是沒用了,而是過時了!
七、A卡先進技術之九:納入DX11的Tessellation技術
DX10.1改動較少,未能帶來驚喜,所以很多玩家慢慢接受了N卡不支持DX10.1也無所謂的事實(但誰也沒有料到NV變化這么快,又支持DX10.1了),并把希望寄托在了微軟下一代API DX11之上,而在DX11的五大主要特性當中,我們發(fā)現有一個非常眼熟的技術——Tessellation。
沒錯,ATI第一代DX10核心R600(HD2900XT)中就整合了一個叫做Tessellation的特殊模塊,從HD2000系列開始、到HD3000再到如今的HD4000系列,ATI的每一款DX10顯卡都支持這項技術,雖然還沒有任何一款游戲能夠支持該技術,但ATI依然孜孜不倦的對它提供支持,因為ATI堅信——是金子總會發(fā)光的!

等到DX11正式接納Tessellation時,這已經是AMD的第六代技術了,真不容易
終于在DX11時代,微軟將Tessellation作為一項重要標準納入規(guī)范之中,這項被埋沒多年的技術得以重見天日。那么Tessellation究竟是何方神圣,讓ATI技術人員如此執(zhí)著,微軟到底是“禁不住軟磨硬泡”、“勉為其難”的吸納之,還是為其先進的特性所傾倒,欣然接納之?故事還得從七年前的Radeon 8500系列談起……
關于Tessellation技術,感興趣的朋友請參閱“七年磨一劍!DX11之ATI獨門絕技全解析”一文,本文不再贅敘。下面簡要介紹Tessellation所能實現的效果:
Tessellation是一種能夠在圖形芯片內部自動創(chuàng)造頂點、使模型細化、從而獲得更好畫面效果的技術。Tessellation能自動創(chuàng)造出數百倍與原始模型的頂點,這些不是虛擬的頂點,而是實實在在的頂點,效果是等同于建模的時候直接設計出來的。
而且,Tessellation過程被安排在了頂點著色之前,這就意味著Tessellation所創(chuàng)造出來的頂點全都可以參與Vertex Shader的處理和運算。這些頂點所帶來的所有細節(jié),將具備所有特效。

拆嵌后再輔以各種陰影及著色效果,從而以很小的代價達到CG級別畫面
在R600發(fā)布時,AMD拿出了一款CG級別實時渲染的Demo,其中被積雪所覆蓋的山體就是由Tessellation生成的。以往的演示Demo都是片面注重對主角的修飾,而背景往往只使用簡單的紋理貼圖,而R600的這個Demo其背景和環(huán)境的精細程度甚至超越了主角Ruby。
除了Demo之外,現在《戰(zhàn)地:叛逆連隊2》第一個跳出來聲援,號稱全球首款DX11游戲,該游戲使用了新版Frostbite Engine,當年ATI演示R600 Ruby Demo的時候使用正是該引擎。戰(zhàn)地引擎的使用者不在少數,看來Tessellation技術以及DX11很快就將進入實際應用階段,臥薪嘗膽的Tessellation終于重見天日!
據DICE渲染架構師Johan Anderson稱,從DX10到DX11的實際導入過程僅僅花費了三個小時,其中在代碼里搜索和替換相關部分最耗時間。現在我們就不難理解戰(zhàn)地引擎升級支持DX11為何如此神速了,兩年前的戰(zhàn)地引擎就能支持Tessellation技術,現在只不過是查找復制粘貼重新找回被閑置的代碼而已,那還不是輕車熟路?
八、ATI顯卡先進技術回顧:性能功能全面的革命性整合平臺
我們不可否認目前整合平臺的崛起和ATI的貢獻是密不可分的。2007年,沉默了將近1年的ATI芯片組,在投入“新東家”AMD懷抱后,終于交出了令人滿意的答卷。ATI 690G芯片組的發(fā)布,讓整合平臺煥發(fā)了第二春,而之后相繼推出的780G更是將整合平臺進行了革命性的演變,成就了全能主板的誕生,而陸續(xù)推出的790GX則是錦上添花,拉開與競爭對手的距離。
整合平臺因690G而崛起:三大優(yōu)勢獨霸業(yè)內
優(yōu)勢1:多媒體關鍵因素
當時大部分主流芯片組均已提供對DX9.0C、HD視頻解碼的支持,但是支持HDMI接口的唯獨AMD 690G一款,是符合vista Premium徽標需求的產品中的少數者。

業(yè)內首款提供HDMI接口支持的整合芯片組產品,AMD 690G此外,AMD 690G芯片組支持HD視頻解碼,包括對H.264/MPEG2/MPEG4的解碼,并且支持未來支持藍光/HD-DVD電影播放,尤其在CPU沒有足夠的速度解碼高分辨率的高清晰視頻下,HD視頻解碼將為CPU減輕負擔。此外,微軟還要求Premiun系統(tǒng)應當支持多顯示器模式,用戶至少能夠使用兩臺顯示器,配備了DVI與D-Sub雙接口的AMD 690G也同樣符合這樣的需求。
優(yōu)勢2:影片畫質提升,CPU占用率下降
AMD在690G整合芯片中加入了AVIVO視頻技術,用以改善畫質與視頻回放能力。
優(yōu)勢3:整合3D性能堪比獨顯且功耗低
當時690G最明顯的優(yōu)勢就是整合3D性能的提升,主要來自兩項重要的改變:80nm制程、整合X1250顯示核心。

當時的690G游戲性能相比同期對手提高30%
由于80nm工藝的引入,使得690芯片組核心面積縮小10%。80nm制程帶來了更低的功耗,當然也使得簡單的散熱片便足以完成芯片散熱的任務,控制整機游戲功耗僅為110W以下。此外,與過去相比,690G芯片組提供了4組Pixel Shader(像素渲染)管線、2個Vertex Shader(頂點著色)引擎以及2個ROP(光柵化操作處理單元),在顯示核心上,與上一代產品相比,規(guī)格翻倍,性能堪比當時1XXX級別的低端顯卡,消費者怎么可能不心動?
780G帶來整合革命:硬解高清/最全接口/板載顯存
性能升級:集成了DX10的相當于2400Pro級別的顯卡在780G的北橋中,集成了相當于AMD的DX10低端顯卡2400Pro級別的整合顯卡,此款顯卡的代號為HD3200,初始為700MHz到800MHz。并將支持北橋緩沖內存(LFB)技術通道。部分780G主板會自帶16-128MB的板載專用顯存“SidePort”,從而不再完全依賴系統(tǒng)內存,因此有利于提高集成顯卡的性能。
提供最強硬件解碼UVD功能
UVD相對于上一代的AVIVO以及NVIDIA當時的解碼技術的優(yōu)勢在于,通吃H.264、VC-1格式的HDTV,通過大量的測試來看,UVD的實力的確非常強悍,可以毫不費力的解壓40Mbps的高碼率視頻,雙核CPU的占用率可以下降至5%以下,即便是古老的賽揚1.7這種低能CPU占用率也能控制在20%左右!
提供最全接口:VGA+DVI+HDMI+DisplayPort
接口方面,780G也毫不馬虎,提供了最全的接口配置,包括VGA、DVI、HDMI,甚至還將會提供DisplayPort接口。并且,780G為了通過HDMI同時輸出音頻和視頻信號,RS780將集成音頻控制器。
正因為780G的推出,令讓兩大芯片廠商如履薄冰,NVIDIA之后推出了MCP78芯片以抗衡780G,雖然在性能和功能上不相上下,但是過晚的推出,早已讓780G占盡先機,自然無法輕易撼動!而Intel推出的全新整合芯片組由于性能和功能的不足,都無法與圖形芯片出身的ATI與NVIDIA相抗衡,一時之間,在整合領域,ATI成為了NVIDIA與Intel不停追趕的目標。
九、ATI顯卡先進技術回顧:高清應用出色/完美VC-1硬解碼
看到了上面的整合主板技術,不禁讓筆者想起了有關高清硬解碼方面的一些技術及爭議。進入DX10時代后,顯卡的3D引擎、核心架構等都有了全新的變化。同樣對于視頻加速方面,NVIDIA與ATI也雙雙升級了自家的視頻加速技術(PureVideo和AVIVO),目的是在高清解碼過程中徹底解放CPU。
NVIDIA最先在G84/G86核心中加入了對H.264完全硬解碼的支持,但對于VC-1依然是半硬半軟的解碼方式,NVIDIA認為,VC-1的壓縮率比H.264低,而且碼率一般也不高(VC-1大概20Mbps左右,H.264是30-40Mbps),VC-1的前途未卜不會是主流,因此不支持VC-1的完全硬解碼也無大礙,聽起來確實很有道理。
ATI稍稍晚了一步,在G84/G86發(fā)布兩個月后ATI推出了RV630/RV610,內部整合的UVD解碼模塊對于H.264和VC-1提供了無差別完全硬解支持,真正做到了徹底解放CPU的目的,UVD確實要更完美一些。

PureVideo HD技術直到第三代才解決了VC-1完全解碼
也許NVIDIA忽視了微軟的影響力(VC-1是微軟的標準),雖然微軟領導的HD-DVD光盤標準已經敗北,但VC-1編碼依然有很多藍光影片在使用,而且碼率越來越高,對CPU資源的消耗也水漲船高。更令人意想不到的是,入門級CPU的性能不升反降(為了追求低功耗,超低壓單核處理器,以及Atom這種順序處理器成為主流),這些處理器根本無法軟解VC-1視頻,NVIDIA半軟半硬的方案也力不存心。
終于,NVIDIA再次妥協(xié),順應歷史潮流推出了第三代視頻解碼方案(VP3),對于H.264、VC-1、MPEG2三大編碼提供了無差別完美硬解支持,代表產品就是入門級的G98核心,以及整合芯片組MCP78、MCP7A、還有之后的離子平臺。不過,完美的硬解僅限入門顯卡及整合顯卡,NVIDIA的中高端顯卡依然不支持VC-1硬解,這一點不如ATI顯卡徹底。
● 高清解碼之爭,未分勝負還是勝負已分?
以現在的眼光來看,NVIDIA的VP3引擎確實要比ATI的UVD2.0更加強大,NVIDIA除了H.264與VC-1外,還對MPEG2提供了完全硬解,而UVD忽視了MPEG2,并非完全硬解;另外NVIDIA領先ATI實現了雙流解碼(高清畫中畫或同時硬解兩部HDTV)以及GPU倍線視頻技術。
但是,NVIDIA的做法很令人費解,自己不支持的時候就避而不談,或者旁敲側擊對方比自己先進的技術,等到自己能夠支持、甚至變得更強的時候反而變得極其低調,堂堂八尺男兒緣何羞于見人?這不由得讓筆者聯想到了美蘇爭霸時期,第一顆人造衛(wèi)星、第一艘載人飛船、第一次登月永遠是最強的,在競爭激烈的尖端科技領域只有第一沒有第二,你可以說你的衛(wèi)星比對手更重、飛船飛行時間更長、各種各技術參數更優(yōu),但你已經輸了。

Folding@home是一個研究蛋白質折疊、誤折、聚合及由此引起的相關疾病的分布式計算工程,也是一個分布式計算的項目。世界各地來的人下載運行這個客戶端程序,彼此組合在一起構成了世界上最大的超級計算機之一。每一臺參與的計算機都使蛋白質折疊項目更接近成功一步。Folding@home把分布式運算和革新的計算方法有機的結合在一起,使人類能解決比以前碰到的困難無數倍的問題。最開始F@H僅支持CPU,后來加入了對PS3游戲機的支持,但同樣是使用內置的CELL處理器做運算。F@H因ATI的加入為GPU計算翻開了新的一頁,如今F@H第二代GPU客戶端已經能夠支持ATI和NVIDIA的全系列DX10 GPU。

根據官方排名來看,NVIDIA早已后來者居上,GPU所貢獻的運算量也超越所有CPU總和,甚至超過了PS3,而參與運算的GPU數量卻要比CPU少很多。ATI GPU的表現也不差,僅次于NVIDIA和PS3,從表中可以看出ATI GPU數量要比NVIDIA少,這可能是A卡市場占用率不夠高、ATI推廣不力、或AFan不夠積極所致。
● GPU視頻編碼:ATI率先實現、NVIDIA全面超越
ATI同樣是GPU視頻編碼的鼻祖,還是在X1000時代,ATI在催化劑驅動中集成了一款名為Avivo VIDEo Converter的小工具軟件,該工具能夠將常見視頻轉換為手持設備(iPod、PSP等)支持的格式,速度比單純CPU編碼快好幾倍。
雖然當時Avivo的速度非常快,但據測試表明該軟件似乎跟GPU的處理能力沒關系,X1300/X1600/X1800/X1900的編碼速度幾乎相同,而且ATI的新顯卡(HD2000/3000/4000)并不支持Avivo編碼器。隨后Avivo被破解,使得它能夠應用在所有DX9/DX10顯卡(包括N卡)上面,于是很多人懷疑Avivo只是一個打著GPU的幌子、通過犧牲畫質換取速度的CPU編碼工具!時過境遷,當Avivo編碼器快被眾人所遺忘,Badaboom大出風頭之時,ATI在2008年最后一款催化劑驅動8.12當中重新啟用塵封已久的Avivo編碼器。
雖然名稱沒變,但ATI稱這個小工具基于Stream流處理技術重新編寫,僅支持HD4000系列顯卡,速度更快,而且同樣堅持完全免費的策略。這對于垂涎Badaboom已久的A卡用戶來說,的確是個不小的驚喜。
根據國外媒體的測試結果,ATI在轉碼速度上擁有更強大的實力,然而卻也使用了更多的CPU占用率作為代價,作為集CPU于GPU于一家的AMD來說,并不在意GPU應用時CPU占用率的高低,不需要去刻意的控制CPU占用率,這或許也是它速度更快的一大原因。ATI稱:Avivo視頻轉換器僅使用GPU完成視頻編碼中的一部分工作,具體的說,GPU目前僅負責視頻編碼過程中對運算能力最敏感,最適于GPU應用的“運動估算”部分。由于在視頻編碼中交給GPU的負載是固定的,因此該過程中的GPU占用率可能因型號的不同而出現高低不等的現象。
NVIDIA雖然速度稍慢,卻在輸出的畫質上明顯高于ATI,CPU占用率也要低出不少。就兩者看來,并沒有一個明顯的贏家,都體現出了GPU的并行計算能力,雖然Avivo速度更快,支持格式更多,但輸出質量結果并不完美。Badaboom輸出畫質質量高,界面精美,但速度比Avivo慢,支持格式也相對有限。
● GPU通用計算,NVIDIA CUDA大出風頭
雖然許多GPU通用計算的概念最早由ATI提出并率先應用,但NVIDIA的標量流處理器架構已經后來者居上,在很多方面都比ATI做得好,不過喝水不忘挖井人,NVIDIA雖然通用計算領域風頭正勁,但是ATI所付出的努力也是不可磨滅的。看看AMD近年來所做出的努力也是顯而易見的,對于GPU功能的開發(fā)也是緊追不舍,并沒有落后NVIDIA太多。

NVIDIA和ATI從3D游戲戰(zhàn)場打到了通用計算領域
回想過去,當ATI率先提出GPU通用計算時,很多人都以為這是天方夜譚,也不知道何年何月才能得償所愿。如今,只花了兩三年時間,GPU就已經在科學研究和超級計算領域取得突破性進展,在民用市場也開始遍地開花。
也許你會為NVIDIA通用計算推廣力和實施力感到驚嘆,也許你也會為ATI因AMD收購而浪費了兩年崛起的時光,但是無論倡導者還是領導者同樣值得我們去給于崇高的敬意。
全文總結:ATI在顯卡領域貢獻不可磨滅
寫了那么多超前的技術,但無可避免的要回到原點,顯卡最重要的還是性能和功能。而這兩方面偏偏是ATI的弱點,性能方面ATI一直苦苦追趕縮小差距,功能方面Stream+DX10.1也完全被CUDA+PhysX所壓制。
由于ATI被AMD收購耽誤了不少時間,加之Intel渾水摸魚挖走了不少人才,導致從DX10時代開始ATI就一直處于落后的地位。此后ATI痛定思痛、臥薪嘗膽,不斷改進和優(yōu)化架構,終于在HD4800時代打了一場漂亮的翻身仗,令對手措手不及。但NVIDIA的GPU無論晶體管、流處理器還是顯存位寬都有明顯優(yōu)勢,因此主動權仍在NVIDIA手里,性能方面ATI始終占不到便宜。
不過ATI在HD4000時代的設計理念卻是成功的,較小的核心和顯存位寬在成本方面有明顯優(yōu)勢,HD4000結束了N卡的暴利時代,將對手龐大的GTX200核心拉下馬,被迫在主流市場進行價格肉搏戰(zhàn)。如果您享受到了千元價位的GTX260+,那么也得感謝ATI的這些先進技術和設計。
總體來看,NVIDIA給人的感覺就是成熟、保守、踏實、務實,每款產品都很在意成本控制,處處透露著商業(yè)的氣息,追求利潤最大化,每年都會有非常可觀的財報(經濟危機特殊時期除外)。而ATI則是努力追求完美卻很難達到,在做工、新工藝、新技術方面很激進,甚至甘愿冒險一試,當然代價就是經常有不成熟的產品或技術。
俗話說,勝敗乃兵家常事,在全球性經濟危機的惡劣環(huán)境下,被收購的ATI依然能夠頂住壓力堅持自己激進冒險派的風格,著實難能可貴。那么ATI接下來的全球首顆40nm+DX11 GPU能帶給大家什么樣的驚喜呢?我們一同拭目以待!■
關注我們


