多少流處理器夠用?四款9系列顯卡橫評
導讀:在很多用戶的意識中,顯卡的參數只有顯存容量和顯存位寬這兩種,而對“流處理器”這個概念知之甚少。然而,實際上流處理器才是當今顯卡最重要的參數,遠遠比顯存容量、顯存位寬重要。今天,本文就是要告訴大家流處理器到底有多重要!
大家知道,在圖形的渲染過程中,主要是像素渲染、頂點渲染以及紋理渲染三大部分組成,這三個步驟也是顯卡渲染出一幅3D圖像必須的過程,每一幅完整的圖像都少不了這幾個步驟。
在Geforce 8系列顯卡之前,執行這三個操作的單元完全獨立,在顯核心內部有專門的像素渲染管線、頂點著色單元、紋理單元,他們各司其職。而到了Geforce 8時代,像素渲染管線和頂點著色單元不再有區別,而是被統稱為“流處理器”,這種將像素管線和頂點單元結合的方式,也就是我們經常聽到的統一渲染架構。

稍微有點硬件知識的朋友就知道,在Geforce 8之前,像素渲染管線和頂點著色單元這兩個參數非常重要,這兩個部分的多少完全決定了顯卡的性能表現,NVIDIA和ATI雙方都為了提升像素管線和頂點單元的數量而想盡一切辦法,比如說提升工藝等。

經典的R580架構,48個像素管線,8個頂點著色單元
但是還有人會注意到,即使在Geforce 8之前,顯卡核心內的渲染管線和頂點著色單元的數量并不一樣,比如說G71就擁有24條像素管線和8個頂點管線,而1950Pro則擁有36個像素單元和8個頂點單元。那這又是為什么呢?這個問題得從“管線渲染架構”的缺點說起!
可以看到,在之前的顯示芯片設計的時候,顯示芯片廠商在設計的時候并不會將頂點管線和象素管線按照相同的數目去做。而是將頂點管線相對放的少一些,多放一些象素渲染管線。
那么顯示芯片廠商為什么要這么做呢?答案是:這樣的結構和比例是芯片設計廠商根據常見游戲的情況而決定的。
不同的游戲在開發的過程中,設計的游戲復雜度是不同的,有的游戲就非常簡單,3D模型也相對簡單,這樣游戲就可以在更多的玩家的電腦上運行。有的游戲的3D模型和后期特效就非常復雜,這樣在保證了游戲的效果的同時就讓很多配置不是那么好的玩家無法運行或者運行起來特別慢。
除去游戲復雜度的區別,游戲的開發商和顯示芯片廠商還處在一個更加難以解決的怪圈中,這就是,游戲開發商無法在游戲的資源消耗定向上達成一致,所以帶給了顯示芯片廠商很大的麻煩。
具體來說就是,有的廠商會開發一些3D模型很復雜,頂點數目很多的游戲,這些游戲就需要耗費很大的頂點渲染管線的資源,這類游戲可以把通常場景很復雜,里面的3D模型的細節非常到位。而另一類廠商則會將焦點放在后期的象素級別的特效,這樣的好處就是可以給游戲帶來更炫的視覺效果。
舉例來說,像《帝國時代3》《英雄連》這樣的游戲,就屬于頂點處理性能要求比較高的,因為這樣的即時戰略游戲很有可能在一個畫面中出現大量的人物,這樣頂點的總數目就會很多,相對消耗頂點渲染管線的性能更加多一些。

而《優品飛車》系列游戲就屬于典型的象素性能要求比較高的,因為在優品飛車中,連最新的《優品飛車10:卡本峽谷》也都沒有支持車輛的損壞,每個車都是一個固定的剛體3D模型,三維頂點數目很少。而如果特效全開的情況下,絢麗的畫面效果非常消耗象素渲染管線的性能,即使最好的顯卡也不會跑得很爽。

不同的游戲風格造成了顯示芯片廠商只能造出更加強大的顯示芯片來滿足這些不同的游戲,但是如何進行配比,將是一個很撓頭的事情,因為這就像一個天平,偏向哪邊都會失去另一部分。
在這種情況下,顯示芯片廠商只能按照最常見的游戲的情況來設計顯示芯片,盡最大能力去滿足不同的游戲。
而游戲廠商在設計游戲的時候也不能隨心所欲的設計游戲,必須滿足顯示芯片的性能配比,這樣才能在消耗性能最小的情況下達到最好的游戲效果。
這個矛盾一天不得到解決,顯示芯片最大的效能就不能有效的得到發揮,這也一直是顯示芯片的性能提高的最大瓶頸所在,在這樣的架構上,不斷的加“管線”,提高頻率是顯示芯片廠商唯一能作的事情。
總結 傳統顯示芯片架構的缺點在于:
1 游戲廠商不能設計出更自由的游戲。
2 顯示芯片的效率不高。
3 顯示芯片的性能提升有限。
很顯然,統一渲染架構的出現就是為了解決這些問題的,因為流處理器既可以處理頂點方面的操作,也可以處理像素方面的操作。統一渲染架構通過專用的超線程調度模塊,根據游戲的負載來指配流處理器按照不同比例處理像素和紋理運算,最大化GPU的資源利用,從而獲得非常好的效能!
經過兩年的發展,統一渲染架構也走向了成熟,如果說G80是DX10初生的嬰兒,那么G9x則正好是青壯年時期的代表。如今,NVIDIA全線產品都已經過渡到了Geforce 9時代,甚至高端市場上都已經推出了GTX 200系列產品。隨著中、低端產品線的完善,產品的規格也層出不窮,比如現在Geforce 9系列產品就高達6、7款。
事實上,從第一款基于統一渲染架構的顯卡G80誕生到現在,NVIDIA顯卡的根本架構就沒有什么大的改變,而現在的Geforce 9系列顯卡,則更加如此了。所有Geforce 9系列顯卡都采用完全一樣的架構,不同產品與不同產品之間最直接的就是流處理器數量、顯存搭配等方面的差距。我們來看看下面這個數據:
| 型號 | 核心 | 流處理器 | 頻率 |
| 9800GTX | G92 | 128SP | 675/1688/2200MHz |
| 9800GT | G92 | 112SP | 600/1500/1800MHz |
| 9600GT | G94 | 64SP | 650/1625/1800MHz |
| 9600GSO | G94 | 48SP | 650/1625/1400MHz |
上面的表格則是當今Geforce 9系列顯卡中,流處理器數量比較具有代表性的幾款產品,大家可以看出除了流處理器數量之外,顯卡頻率也不盡相同。
大家知道,頻率是顯卡廠商可以任意調整的,一款體制好的顯卡,超頻后性能有很大的提升,一款體制較差的產品,可能很難以超頻。而顯存頻率則更加靈活,顯卡廠商可以采用各種高低頻率的顯存顆粒,并且在這個基礎之上還可以進行超頻與降頻等。而唯一更改不了的,就是流處理器數量。
流處理器數量和核心是與生俱來的,同一款核心的產品,不管它來自那個品牌,其流處理器數量都是完全一樣的。NVIDIA也正是通過控制流處理器數量來推出面向各種市場級別的顯卡。所以說,一款顯卡中含有的流處理器數量越多,那么它的性能就越好。
在很多人的意識中,顯卡的容量是放在第一位的,筆者逛中關村的時候經常會聽到,“這顯卡是多少兆的?”...... 。而事實上,顯卡有多少兆并不重要,重要的還是流處理器的數量。下面,我們就要來告訴你流處理器到底有多重要。
本次測試我們選擇的是Geforce 9系列顯卡中四款流處理器數量不一樣,而顯存規格均為512M/256Bit的幾款產品,實際上和前面那一頁表中介紹的那幾款差不多。
|
硬件系統配置 | |
|
Intel E8200 2.66GHz | |
|
主 板 |
MSI X48C 白金版 |
|
顯 卡 |
Inno3D 9800GTX 128SP 盈通9800GT游戲高高手 112SP 小影霸GX5 9600GT 64SP Inno3D 9600GSO 48SP |
|
內 存 |
Geil DDR2-800 1GB×2 (5-5-5-15-2T) |
|
硬 盤 |
希捷7200.10 |
|
電 源 |
海韻 M12 600W |
|
軟件系統配置 | |
|
Windows vista SP1 32Bit | |
|
DirectX |
10.0 (6.00.6000.16386) |
|
顯示驅動 |
Forceware 180.43Beta |
我們統一在完全一樣的測試平臺、軟件測試環境下進行測試,為了讓成績精確,我們甚至將四款參測顯卡的頻率都設定在650/1625/1800MHz上面。同時顯卡的驅動程序也采用NVIDIA最新的Beta版FW 180.43。另外,我們還關閉了顯卡的物理加速功能。
測試方法和我們之前測試顯卡基本無太大差距,主要是通過游戲來了解顯卡的流處理器數量到底有多重要。好,下面我們正式開始測試!
● DX10基準性能測試——3DMark Vantage
由于本次參加測試的顯卡既有高端的,中低端的產品,所以我們在3DMark Vantage測試中,選擇了比較折中的Performance模式進行測試,避免低端顯卡跑不動的情況。

為了讓大家能夠直觀的看出流處理器數量帶來的性能差距,我們通過計算相鄰性能的兩塊顯卡之間得分的百分比來展示:
● 擁有64個流處理器的9600GT相對于擁有48個流處理器的9600GSO來說,性能提升幅度為18%;
● 擁有112個流處理器的9800GT相對于擁有64個流處理器的9600GT來說,性能提升幅度為16%;
● 擁有128個流處理器的9800GTX相對于擁有112個流處理器的9800GT來說,性能提升幅度為2%;
為什么會出現顯卡越高,性能提升的百分比反而越低呢?我們將在最后的總結中給大家說明。我們繼續看游戲的成績以及性能提升的百分比!
● 2007年度非常好的游戲——《使命召喚4:現代戰爭》
由于《使命召喚3》是XBOX360獨占游戲,并沒有PC版本,因此PC游戲玩家對于使命召喚系列游戲的印象大都停留在《使命召喚2》時代,但經典的《使命召喚2》給玩家帶來了不一樣的二戰游戲體驗,因此支持PC版的4代作品備受期待。此次《使命召喚4》全平臺出擊,自發布以來就好評不斷,銷量長期霸占榜首!
自從《使命召喚4》宣布以現代戰爭(Call of Duty 4:Modern Warfare)為游戲主軸,許多好奇的玩家就不斷在猜測,注重歷史寫實的Infinity Ward會把戰場移至何處,大部份都以為會是越戰或是伊拉克戰爭。但是為了避開敏感的話題,開發小組選擇創作虛構的故事,將戰爭帶領至更多想像之外的國家。此次《使命召喚4》挾著“至今最緊張刺激的FPS游戲”訴求,將戰場拉到現在的中東及東歐等區域。
雖然使命召喚4的場景已不再是二戰,但它依然保持了和使命召喚2/3系列相近的畫面風格,相信老玩家在游戲中一定會有親切感,戰斗中的爆炸、煙霧效果更加逼真,物理效果也加強了游戲的真實感。
● 畫面設置和測試方法
使命召喚4引擎對顯卡的要求不像DX10游戲那么BT,中端顯卡特效全開都能有不低的FPS,這也是它能夠迅速普及的原因。所以,本次測試我們直接采用1680×1050的分辨率,并且分別開啟AA和不開啟AA進行測試。
測試方法:Demo有一段固定的爆炸場景,FPS比較穩定,也符合游戲實際運行時的情形,用Fraps統計這個過程的FPS,作為最終成績。

相鄰性能兩款顯卡的性能差距百分比:
● 擁有64個流處理器的9600GT相對于擁有48個流處理器的9600GSO來說,性能提升幅度為13%;
● 擁有112個流處理器的9800GT相對于擁有64個流處理器的9600GT來說,性能提升幅度為20%;
● 擁有128個流處理器的9800GTX相對于擁有112個流處理器的9800GT來說,性能提升幅度為2%;

相鄰性能兩款顯卡的性能差距百分比:
● 擁有64個流處理器的9600GT相對于擁有48個流處理器的9600GSO來說,性能提升幅度為12%;
● 擁有112個流處理器的9800GT相對于擁有64個流處理器的9600GT來說,性能提升幅度為26%;
● 擁有128個流處理器的9800GTX相對于擁有112個流處理器的9800GT來說,性能提升幅度為2%;
●DX9C游戲性能測試:《帝國時代3:亞洲王朝》
其畫面風格一如既往的華麗無比,雖然游戲引擎比較老,但通過精妙的色彩搭配和美術設計,《帝國3》比起DX10 RTS大作《英雄連》和《沖突世界》都是不落下風。
畫面設置:帝國3的最新資料片也使用了原來的游戲引擎,畫面風格沒有任何變化,系統需求也是照舊,對于如今的顯卡來說特效全開并且打開抗鋸齒運行游戲沒有任何難度。起“邊緣光滑”開啟至“高”就是4AA。分辨率同樣為1680×1050。
測試方法:及時戰略游戲如果沒有專用測試程序,就很難在游戲中公平的測試,所以我們選用了游戲即時演算的主界面統計幀數,也能客觀的反映出各卡在該游戲中的差距。

相鄰性能兩款顯卡的性能差距百分比:
● 擁有64個流處理器的9600GT相對于擁有48個流處理器的9600GSO來說,性能提升幅度為13%;
● 擁有112個流處理器的9800GT相對于擁有64個流處理器的9600GT來說,性能提升幅度為15%;
● 擁有128個流處理器的9800GTX相對于擁有112個流處理器的9800GT來說,性能提升幅度為3%;

相鄰性能兩款顯卡的性能差距百分比:
● 擁有64個流處理器的9600GT相對于擁有48個流處理器的9600GSO來說,性能提升幅度為12%;
● 擁有112個流處理器的9800GT相對于擁有64個流處理器的9600GT來說,性能提升幅度為11%;
● 擁有128個流處理器的9800GTX相對于擁有112個流處理器的9800GT來說,性能提升幅度為1%;
●DX9C游戲性能測試:《半條命2:第二章》
《半條命2:第二章》作為《半條命2:第一章》的續集,引擎在HDR和室外場景的渲染方面有所增強,樹葉渲染上將采用Alpha覆蓋技術,提供更好的樹葉細節和反鋸齒效果。此外還引入全新的粒子系統,將提供動態軟陰影效果。物理引擎也經過重新設計,提供大場景大范圍的物理效果。
畫面設置:《第二章》還是原來的Source引擎,雖然做了一些改進,但對顯卡的要求并沒有提高,所以我們測試時特效全開最高,并且打開游戲自帶的AA和AF。
測試方法:游戲支持命令錄制demo供測試,我們錄制的demo覆蓋了室內室外場景。

相鄰性能兩款顯卡的性能差距百分比:
● 擁有64個流處理器的9600GT相對于擁有48個流處理器的9600GSO來說,性能提升幅度為15%;
● 擁有112個流處理器的9800GT相對于擁有64個流處理器的9600GT來說,性能提升幅度為21%;
● 擁有128個流處理器的9800GTX相對于擁有112個流處理器的9800GT來說,性能提升幅度為1%;

相鄰性能兩款顯卡的性能差距百分比:
● 擁有64個流處理器的9600GT相對于擁有48個流處理器的9600GSO來說,性能提升幅度為13%;
● 擁有112個流處理器的9800GT相對于擁有64個流處理器的9600GT來說,性能提升幅度為18%;
● 擁有128個流處理器的9800GTX相對于擁有112個流處理器的9800GT來說,性能提升幅度為1%;
● DX9C最新賽車游戲:《優品飛車11》
如果你已經厭煩了在黑夜里飆車,那么《優品飛車11》一定能再次讓你滿意,因為這次EA讓玩家們在NFS的世界里重見了陽光。不管優品飛車系列怎么改變,不變的就是那些忠實的老玩家還有源源不斷的新玩家。
優品飛車幾乎每年一次更新,在上一代作品發布的一年后,EA為我們帶來了系列的最新作《ProStreet》。告別了連續幾代的黑夜,重新迎來了太陽。
● 畫面設置和測試方法
在上一代的《優品飛車10》中畫面設置是不支持目前主流的寬屏分辨率的。而在新作中這種問題已經得到解決,玩家們的大屏幕顯示器不會再次面臨英雄無用武之地的尷尬。我們將所有效果開啟至最高并分別開關AA和AF。
測試模式:特效全開最高我們選取NEVADA HIGHWAY賽道進行游戲,使用Fraps統計在相同賽道段的平均FPS。

相鄰性能兩款顯卡的性能差距百分比:
● 擁有64個流處理器的9600GT相對于擁有48個流處理器的9600GSO來說,性能提升幅度為9%;
● 擁有112個流處理器的9800GT相對于擁有64個流處理器的9600GT來說,性能提升幅度為6%;
● 擁有128個流處理器的9800GTX相對于擁有112個流處理器的9800GT來說,性能提升幅度為2%;

相鄰性能兩款顯卡的性能差距百分比:
● 擁有64個流處理器的9600GT相對于擁有48個流處理器的9600GSO來說,性能提升幅度為11%;
● 擁有112個流處理器的9800GT相對于擁有64個流處理器的9600GT來說,性能提升幅度為5%;
● 擁有128個流處理器的9800GTX相對于擁有112個流處理器的9800GT來說,性能提升幅度為2%;
●OpenGL游戲性能測試:《雷神戰爭》
《敵占區:雷神戰爭》作為QUAKE系列游戲的最新作,由于引擎源自Doom 3,但比DOOM3在很多方面都有所加強,最引入注目的MegaTexture技術的首次使用。簡單而言,MegaTexture就是一張超大的貼圖。在《敵占區:雷神戰爭》中每張MegaTexture容量達到了3GB(類似ClipTexture,并非全場景的動態貼圖),在得到更好效果的同時,對顯存容量的要求也更高。除此之外,引擎還引入了視差映射、凸凹紋理映射、法向映射和Specular Highlighting、軟粒子等目前流行的顯示技術。
畫面設置:畢竟是源于老邁的DOOM3架構,引擎無論如何改進,對配置的要求也不可能出現翻天覆地的變化,自然是特效全開,并開啟游戲內置的4AA16AF。
測試方法:我們自行錄制了一段多人對戰Demo,調用游戲內置的控制臺命令行播放錄像,然后就可以得到比較準確的全程FPS。第一次回放Demo時由于Loading的原因成績較低,所以取第二次的成績為最終結果。

相鄰性能兩款顯卡的性能差距百分比:
● 擁有64個流處理器的9600GT相對于擁有48個流處理器的9600GSO來說,性能提升幅度為16%;
● 擁有112個流處理器的9800GT相對于擁有64個流處理器的9600GT來說,性能提升幅度為6%;
● 擁有128個流處理器的9800GTX相對于擁有112個流處理器的9800GT來說,性能提升幅度為18%;

相鄰性能兩款顯卡的性能差距百分比:
● 擁有64個流處理器的9600GT相對于擁有48個流處理器的9600GSO來說,性能提升幅度為16%;
● 擁有112個流處理器的9800GT相對于擁有64個流處理器的9600GT來說,性能提升幅度為28%;
● 擁有128個流處理器的9800GTX相對于擁有112個流處理器的9800GT來說,性能提升幅度為9%;
● DX10 RTS游戲——《沖突世界》
看之前的游戲介紹,很多人都以為這是一款FPS游戲,因為它的畫面效果和模型細節實在是太細膩了,事實上它是一款RTS游戲,一款場景比《英雄連》還有宏大、細節和特效更加豐富的即時戰略游戲!
《沖突世界》(World in Conflict)是一款以假想的世界戰爭為題材的新作,在游戲的開場動畫中,玩家就可以看到重裝坦克入侵美國的大街小巷,士兵架著機槍在海岸線上殊死保衛。西雅圖遭到了嚴重的空襲。本作的劇本作者Larry Bond是知名的暢銷書作者,與湯姆?克蘭西一起創作了《Red Storm Rising》,曾經參與了《魚叉》系列海戰游戲的開發,這次他與Massive的游戲開發大師們合作為玩家帶來了又一款軍事驚悚游戲。
● 畫面設置和測試方法
《沖突世界》游戲自帶的畫面設置多達44個選項,預置Very High/High/Medium/Low幾種模式, 本次測試采用High模式,然后手動開啟關閉AA/AF選項,對比幾款顯卡的性能表現:
《沖突世界》和《英雄連》類似,內置了一段非常華麗的過場動畫作為測試程序,最終得出最大、最小和平均FPS,測試結果非常精確。

相鄰性能兩款顯卡的性能差距百分比:
● 擁有64個流處理器的9600GT相對于擁有48個流處理器的9600GSO來說,性能提升幅度為14%;
● 擁有112個流處理器的9800GT相對于擁有64個流處理器的9600GT來說,性能提升幅度為10%;
● 擁有128個流處理器的9800GTX相對于擁有112個流處理器的9800GT來說,性能提升幅度為2%;

相鄰性能兩款顯卡的性能差距百分比:
● 擁有64個流處理器的9600GT相對于擁有48個流處理器的9600GSO來說,性能提升幅度為13%;
● 擁有112個流處理器的9800GT相對于擁有64個流處理器的9600GT來說,性能提升幅度為4%;
● 擁有128個流處理器的9800GTX相對于擁有112個流處理器的9800GT來說,性能提升幅度為0%;
● 首款DX10游戲大作——《失落星球:極限狀態》
2007年5月份正式發布的《失落星球:極限狀態》(Lost Planet:Extreme Condition),是業界首款支持DX10的游戲,它的發布打破了長久以來DX10顯卡沒有DX10游戲可玩的僵局,因此受到了大批PC玩家的青睞,并迅速成為顯卡性能測試工具之一。
《失落星球》無論DX10還是DX9版本,畫面都非常出色,但除了絢麗的畫面之外,游戲本身也是可圈可點,最大的特色就是節奏緊湊、戰斗過程緊張、激烈、刺激,關卡的BOSS戰需要很高的操作技巧和靈活性,需要反復嘗試才能通過,這非常適合那些喜歡挑戰極限的玩家。所以該游戲雖然關卡不多,但所得到的游戲體驗比較豐富,其任務系統非常簡單,但情節引人入勝,大有一玩到底、不通關誓不罷休的味道。
● 畫面設置和測試方法
《失落星球》最新的1.004補丁加入了四項DX10特效,并且大幅改進了DX10模式下的執行效率。本次我們測試依然采用1680×1050的分辨率,特效開最高,手動開啟/關閉AA/AF選項,下面來看看測試成績。

相鄰性能兩款顯卡的性能差距百分比:
● 擁有64個流處理器的9600GT相對于擁有48個流處理器的9600GSO來說,性能提升幅度為13%;
● 擁有112個流處理器的9800GT相對于擁有64個流處理器的9600GT來說,性能提升幅度為15%;
● 擁有128個流處理器的9800GTX相對于擁有112個流處理器的9800GT來說,性能提升幅度為7%;

相鄰性能兩款顯卡的性能差距百分比:
● 擁有64個流處理器的9600GT相對于擁有48個流處理器的9600GSO來說,性能提升幅度為9%;
● 擁有112個流處理器的9800GT相對于擁有64個流處理器的9600GT來說,性能提升幅度為10%;
● 擁有128個流處理器的9800GTX相對于擁有112個流處理器的9800GT來說,性能提升幅度為6%;
●DX10游戲性能測試:《生化奇兵》
早在游戲Demo版發布之前,BIOSHOCK就已經聲名遠揚,著名游戲雜志Gameinformer在較早的時候對其進行了完整測試,并給出了驚人的滿分10分,將幾乎所有的溢美之詞都獻給了這款游戲,稱之為難得一見的史詩性大作。
測試方法:《生化奇兵》并不像其他幾款DX10游戲那樣自帶測試程序,所以我們只能用Fraps來記錄游戲運行的實時FPS,測試場景選取了第一關動態海面作為戶外模式獲得成績。

相鄰性能兩款顯卡的性能差距百分比:
● 擁有64個流處理器的9600GT相對于擁有48個流處理器的9600GSO來說,性能提升幅度為27%;
● 擁有112個流處理器的9800GT相對于擁有64個流處理器的9600GT來說,性能提升幅度為17%;
● 擁有128個流處理器的9800GTX相對于擁有112個流處理器的9800GT來說,性能提升幅度為2%;
●DX10游戲性能測試:《孤島危機》
Crysis(孤島危機)無疑是現階段對電腦配置要求最高的PC游戲大作。Crysis的游戲畫面達到了當前PC系統所能承受的極限,超越了次世代平臺和之前所有的PC游戲。
畫面設置:游戲版本為V1.2,如果開啟最強DX10效果(Very High),即便是許多高端顯卡也只能在低分辨率看幻燈片,所以本次我們只是在1024×768分辨率下的High模式分別開啟AA/AF和不開啟AA/AF進行測試。
測試方法:Crysis內置了CPU和GPU兩個測試程序,我們使用GPU測試程序,這個程序會自動切換地圖內的全島風景,得到穩定的平均FPS值。

相鄰性能兩款顯卡的性能差距百分比:
● 擁有64個流處理器的9600GT相對于擁有48個流處理器的9600GSO來說,性能提升幅度為13%;
● 擁有112個流處理器的9800GT相對于擁有64個流處理器的9600GT來說,性能提升幅度為15%;
● 擁有128個流處理器的9800GTX相對于擁有112個流處理器的9800GT來說,性能提升幅度為3%;

相鄰性能兩款顯卡的性能差距百分比:
● 擁有64個流處理器的9600GT相對于擁有48個流處理器的9600GSO來說,性能提升幅度為19%;
● 擁有112個流處理器的9800GT相對于擁有64個流處理器的9600GT來說,性能提升幅度為17%;
● 擁有128個流處理器的9800GTX相對于擁有112個流處理器的9800GT來說,性能提升幅度為2%;
前面我們一共測試了9個游戲和一個3DMark Vantage基準性能,可以看出,64個流處理器的9600GT相對于48個流處理器的9600GSO性能提升基本都在10%以上(極個別游戲除外),112個流處理器的9800GT相對于64個流處理器的9600GT性能提升也基本都在10%以上(極個別游戲除外),甚至部分游戲超過了20%。但為什么128個流處理器的9800GTX相對于9800GT,性能提升卻都在5%以內呢?是不是這個時候,流處理器的作用就不大了呢?
實際上,我們沒有辦法完全這么說,可以這樣理解:當9600GT、9800GT的時候,由于是中端顯卡,顯存還無法對核心的處理能力造成瓶頸,所以這個時候只要流處理器數量有所提升,性能則會有很大的提升幅度。而在9800GTX上,由于核心處理能力非常強大,此時顯存已經滿足不了核心強大的數據處理能力,這時候顯存就成了顯卡上的瓶頸,比如帶寬、容量,所以在這種情況下,即使提升流處理器的數量,性能提升也不明顯。
另外大家可能普遍發現9600GT與9800GT的性能差距比較大,這又是為什么呢?實際上很好理解,9600GT擁有64個流處理器,而9800GT擁有112個流處理器,兩者的流處理器差距高達48個;而9600GSO與9600GT的差距只有16個,同樣9800GT與9800GTX的差距也只有16個,所以9600GT與9800GT之間的差距大也是理所當然的,甚至我們發現他們之間的差距比我們想象中的還要小一些,證明在9800GT這個階段,顯存已經對核心產生了不太明顯的瓶頸。
所有的測試均反映了以下幾個問題:
● 流處理器數量對于中端顯卡非常重要,買中端、主流顯卡的時候,一定要注意盡量購買流處理器數量較多的產品;
● 在千元級顯卡上,512M/256Bit的顯存搭配已經對核心造成了瓶頸,顯存帶寬可以通過提升頻率來提高吞吐量,所以這也是各大廠商為什么要在千元級顯卡大量推出高頻版本的原因;
● 在高端顯卡上,顯存的容量也非常重要,特別是在運行DX10游戲并開啟AA/AF時,大容量顯存性能會有質的提升;而在低端顯卡上,則不用太注重顯存的容量;
總之,大家在購買顯卡的時候,一定不要先問顯卡是多少兆的,而是要先問有多少個流處理器,將流處理器數量放在首位,才能保證購買到性價比高的產品。<
關注我們


