關公戰秦瓊!4套CPU/GPU決戰視頻轉碼
幾年前,提起GPGPU(General-Purpose computing on GPU,GPU通用計算),大家可能還覺得是天方夜譚,也不知道何年何月才能得償所愿。而且對于新生事物總會有很多疑問:GPU真比CPU強很多?GPU作用超過CPU或僅是協處理器?GPU能挑戰CPU的地位嗎?
如今,只花了兩年時間,GPU就已經在科學研究和超級計算領域取得突破性進展,在民用市場也開始遍地開花,基于CUDA和Stream技術的軟件如雨后春筍版相繼發布,讓大家對于GPU有了一個全新的認識——原來GPU除了3D渲染和游戲,還能干這么多事情。
不過,第一批CUDA/Stream軟件主要還是集中在視頻編輯/轉碼應用,比如Badaboom、AVIVO、MediaShow、MediaCoder等。在這些軟件發布時我們都于第一時間進行了性能測試,前不久通過對國內首款CUDA視頻轉碼軟件MediaCoder的測試發現,該軟件完美支持多核CPU及指令集、再加上CUDA加速的助陣,其性能輕松超越CUDA代表作Badaboom,讓電腦視頻轉換性能更上一層樓。
但很多朋友對我們的評測也產生了質疑,認為選用Core i7平臺太過高端、測試的視頻不具代表性、而且MeidaCoder與Badaboom的用戶定位也不同。通過吸取網友的意見和建議,我們決定對目前已正式發布的支持GPU轉碼的軟件進行一次橫評,詳細對比各款軟件之間的性能差異、輸出畫質及兼容性,通過多套平臺對比高中低端CPU與GPU的實力。
● CUDA加速的鼻祖:Badaboom
GPU視頻編碼的鼻祖應該是ATI的AVIVO Video Convert,在X1000時代ATI就隨驅動附贈這款小工具,但由于輸出畫質差、功能有限、高中低端顯卡毫無差別的原因,該軟件爭議比較大,此后AVIVO沉寂了很長一段時間,并不再對HD2000/HD3000顯卡提供支持。
真正使用GPU進行轉碼的軟件,Badaboom是第一款,Badaboom再次喚醒了人們對GPGPU的認識,AMD也因Badaboom的崛起而重新啟動了AVIVO Video Convert這個小工具,來使用HD4000顯卡進行視頻轉碼,遺憾的是,跟4年前相比該工具沒有多大改進。
現在筆者就主要介紹下Badaboom這款軟件,該軟件版本更新很頻繁,經過一年多時間的發展,兼容性不斷加強、轉換效率越來越高,雖然還存在一些問題,但作為CUDA應用的鼻祖,也是一款好用且速度快的視頻轉碼軟件。
● Badaboom支持的視頻種類:
- 輸入視頻編碼:MPEG、MPEG2、VC-1、H.264/AVC、AVCHD、HDV、RAW、WMV、VC-1、DivX、Xvid、FRAPS
- 輸入音頻編碼:AC-3、MP2、PCM、AAC
- 輸入視頻格式:M2V、MPG、VOB、AVI、TRP、TS、M2T、M2TS、MPEG、MTS、MOV、MP4、MKV、WMV
- 輸出視頻編碼:H.264(MP4),支持Baseline Profile、Main Profile,最高支持4.1版本,支持CABAC、動態比特率、反交錯
- 輸出視頻分辨率:最高1080p,最低320p,常見分辨率均支持
- 輸出視頻碼率:500Mbps~2500Mbps
- 輸出音頻編碼:AAC-LC(2 Channel)
● Badaboom的特點和優點:
- 界面簡潔,極易上手
- 專門針對手持設備和娛樂設備設計,輸出兼容性很好
- 對GPU利用率很高,轉碼速度快
● Badaboom的缺點:
- 界面支持中文,卻不支持中文文件名和目錄
- 網絡流行的RMVB不支持,很多AVI和WMV也不支持
- 不支持壓字幕到視頻里面
- 不支持批量轉換
● Badaboom最新版本:1.2.1.7
- Badaboom 1.2.1.7測試版下載鏈接
- 測試版30次轉換機會,轉出視頻帶Elemental Logo
- 完整版售價29.99美元(204.88人民幣)
● 同時支持CUDA與Stream:MediaShow Espresso
Cyberlink(訊連科技)旗下大名鼎鼎PowerDVD相信大家都非常熟悉,作為一家專注視頻與多媒體的軟件開發商,Cyberlink不久前推出了一款專業的快速視頻轉換軟件——MediaShow Espresso,需要注意的是MediaShow(魅力四射)是一款視頻編輯軟件,而MediaShow Espresso才是視頻轉換軟件。
MediaShow Espresso是第一款同時支持CUDA與Stream加速的視頻轉換軟件,除此之外它還對Intel Core i7處理器的超線程及SSE4指令集做了優化,因此無論純CPU轉碼還是GPU加速,其速度比傳統軟件都要快。
界面簡潔明了,功能和操作方法一目了然,這就是MediaShow Espresso的最大特色,它與Badaboom的類似,主要針對手持設備或娛樂設備轉換視頻。其兼容性與Badaboom不相上下,但視頻輸出格式更多,沒有局限于MP4這一種,但在自定義分辨率和碼率方面,沒有Badaboom那么靈活。
這種內置輸出模式的設定,對于高級用戶來說可能不夠靈活,但對于初級用戶來說還是很方便的,用戶無需關心視頻的畫質及分辨率,軟件內置的模式肯定是最優的方案。

軟件能自動識別顯卡是否支持CUDA或Stream,默認為開啟
● MediaShow Espresso支持的視頻種類:
- 輸入視頻格式:AVI、MPEG、MPEG-2、MOV、WMV、MP4、DVR-MS、TS、MPG、ASF、M2T、M2TS、MTS、DV-AVI、VOB、VRO、MOD、DAT、TOD、TiVo、WTV
- 輸出視頻格式:MPEG2、MPEG4、MPEG4 AVC、WMV
- 兼容輸出設備:iPhone、iPod Touch、iPod Nano、iPod Classic、PSP、PlayStation 3、XBox、Zune
- 輸出視頻分辨率:針對特殊設備設定,分辨率有限,無法自定義
- 輸出視頻碼率:針對手持設備優化,無法自定義碼率
● MediaShow Espresso的特點和優點:
- 界面友好,操作方便
- 專門針對手持設備和娛樂設備設計,輸出兼容性很好
- 同時支持CUDA和Stream,并對i7優化
- 支持批量轉換
● MediaShow Espresso的缺點:
- 網絡流行的RMVB不支持,和不少M2TS、AVI等也存在兼容性問題
- 不支持壓字幕到視頻里面
- 分辨率和碼率都無法自定義
● MediaShow Espresso最新版本:5.0.0430.12419
- MediaShow Espresso最新試用版下載鏈接
- 30天使用期限,免費轉換H.264視頻50次
- 完整版售價260元人民幣
● 唯一免費的轉碼軟件:MediaCoder
前面兩款軟件雖然界面美觀、操作簡便,但都是價值不菲的商業軟件,售價達200元以上,下面介紹的這款視頻轉換軟件則是完全免費的國產開源軟件。
MediaCoder是一個免費的通用音頻/視頻批量轉碼工具,它將眾多來自開源社區的優秀音頻視頻編解碼器和工具整合為一個通用的解決方案,可以將音頻、視頻文件在各種格式之間進行轉換。MediaCoder具備一個可擴展的架構和豐富的功能,可滿足各種場合下的轉碼需求。目前,MediaCoder的用戶已經遍布全世界170多個國家。
通俗一點的說:玩高清的朋友一定用過終極解碼或者完美解碼吧,終極解碼就是整合了一大堆播放器和解碼器的視頻播放軟件,而MediaCoder就是整合了一大堆編碼器和插件的視頻轉碼軟件。功能大而全、靈活性高、開源、免費是這類軟件的共性,如果要為MediaCoder起個中文名稱的話,筆者認為“終極轉碼”或者“完美轉碼”都不錯^_^。
MediaCoder的版本更新非常頻繁,其開發團隊在馬不停蹄的加入各種新的功能并優化轉碼效率,自引入CUDA編碼器以來就針對用戶的需求以及發現的BUG不斷修正,目前已經趨于完善。
● MediaCoder功能簡介:
- 實現各種音頻視頻格式間的相互轉換
- 豐富的可調整的編碼參數
- 豐富的視頻處理濾鏡,包括反交錯、裁剪、分辨率調整、亮度色彩調整等
- 豐富的音頻處理濾鏡,包括聲道映射、重采樣、音量調整等
● MediaCoder主要特點:
- 完全免費,版本更新極為頻繁
- 幾乎支持所有類型的視頻,包括網絡流行的RMVB、DIVX等,可以轉換為任何類型的視頻
- 為多核、多線程優化,支持SSE4.1、X64等最新處理器指令集
- 視頻/音頻參數完全自定義,可調整范圍寬大
- CUDA加速可以支持將所有類型的視頻轉換為H.264/X264編碼,包括M2TS、TS、MP4、MKV、MOV等眾多封裝格式
- 支持將字幕壓入視頻
- 有影音設備專用版本,完整版也內置了轉碼參數及優化方案
● MediaCoder的缺點:
- 界面比較復雜專業,上手比較難
- 功能太多,存在一些BUG
● MediaCoder最新版本:0.7.1.4476
- MediaCoder 0.7.1.4475 32bit完整版下載鏈接
- MediaCoder 0.7.1.4476 32bit升級補丁下載
- MediaCoder 0.7.1.4476 64bit升級補丁下載
- 32bit系統用戶下載前兩個,64bit系統用戶安裝第三個補丁會有性能提升
- 4476版進一步優化了CUDA轉碼的效率和兼容性
● 測試視頻的選擇:兩部具有代表性的視頻
為了更加貼近廣大用戶日常操作時的應用,筆者選擇了兩部視頻進行轉碼測試,考慮到一整部電影的轉碼時間動輒好幾個小時,因此測試用影片為片段。

第一部為DVD轉iPhone,模擬經常為手持設備轉視頻的那部分用戶。影片為《刺殺希特勒》拍攝花絮,DVD MPEG2編碼,720×576分辨率,將其轉換為iPhone支持的480×270分辨率,H.264編碼MP4封裝。
第二部為1080p轉720p,模擬經常為網絡提供720p視頻下載的那部分熱心用戶、或者想把高清視頻壓縮保存至DVD刻盤的那部分“光盤黨”。影片為《007之大破量子危機》預告片,1080p H.264編碼M2TS封裝,將其轉換為720p H.264編碼MP4封裝。
● 測試軟件設置:保證三款軟件擁有相同的碼率和格式
三款軟件中,只有MediaShow Espresso是無法自定義碼率和格式的,因此所有的測試均以MediaShow Espresso為準,通過分析MediaShow Espresso轉換輸出文件的碼率和格式,讓Badaboom和MediaCoder向它看齊,最大限度的保證三款軟件輸出視頻擁有相同的畫質。
- MediaShow Espresso設置說明:
第一部視頻,MediaShow Espresso直接輸出iPhone 480×270分辨率即可,最終視頻碼率為1500Kbps。
第二部視頻,MediaShow Espresso輸出為PS3 1280×720分辨率,最終視頻碼率為10000Kbps。
MediaShow Espresso的CUDA加速默認為開啟,除了測試四款顯卡的加速能力之外還測試了純CPU編碼時的轉碼速度,作為對比。
- Badaboom設置說明:
第一部視頻,Badaboom內置的iPhone轉碼方案與MediaShow Espresso完全相同,視頻碼率也是1500Kbps,因此不用做任何設置直接轉碼即可,最終獲得的視頻文件體積也與MediaShow完全相同。
第二部視頻,Badaboom選擇右側最下方的自定義方案,碼率設定為10050Kbps(沒有10000這個整數),選擇Main Profile、開啟CABAC、H.264 4.0版(為了與MediaShow保持一致),音頻碼率提高到256Kbps,這樣就能獲得與MediaShow差不多畫質/大小的視頻。
Badaboom不支持純CPU轉碼,因此不進行軟解測試,但會額外加入單卡最強的GTX285代替,看看比起GTX260+還會不會有提升。
- MediaCoder設置說明:
MeidaCoder其實也提供了參考轉碼方案,但必須安裝FireFox瀏覽器并聯網才能訪問“功能”“設備轉碼平臺”,然后選擇iPhone設備。這樣做太麻煩,還不如自行手動設定,參考設置如下:

紅圈所示選項就是開啟GPU加速:GPU編碼和GPU壓縮分辨率
第一步視頻,使用上圖所示的設定,轉換出來的視頻就與Badaboom沒有太大差別,都是Baseline 2.1版本,接近1500Kbps的碼率,輸出文件體積相差不過1MB。
第二部視頻稍作更改,分辨率改為720p,碼率增至10000Kbps,H.264版本調為與MediaShow和Badaboom相同的High 4.0配置,并開啟CABAC,最終獲得的視頻文件碼率和體積都差不多。
將編碼器換為X264就能禁用GPU編碼,完全使用普通的CPU編碼,這樣就能直接對比CUDA編碼器與X264編碼器的轉換效率,看看性能提升幅度到底有多大。
一切準備就緒,PK正式開始。
其實支持GPU加速的視頻轉碼軟件還有不少,比如PowerDirect、TMPGEnc等,不過這些軟件主要應用領域是視頻編輯,即為視頻增加一些特效、渲染、進行后處理等,GPU只是起到畫龍點睛的作用,并不能利用到GPU的龐大的運算資源。
只有視頻轉碼才是最消耗CPU及GPU資源的應用,四核八線程的Core i7在壓片時也會力不存心,240個流處理器的GTX285在轉碼時也能滿負荷運轉。因此筆者選擇了目前三款最流行的視頻轉碼軟件進行測試。
● 測試系統配置:
|
硬件系統配置 | |
|
Core i7 920 2.66GHz Core 2 Quad Q9550 2.83GHz Core 2 Duo E8400 3.0GHz Pentium Dual Core E5300 2.6GHz | |
|
華碩 P6T Deluxe(X58) 華碩Rampage Extreme(X48) | |
|
日立1TB HDE721010SLA330 | |
金泰克DDR3-1333 2GBx3(X58) 金泰克DDR3-1333 2GBx2(X48) | |
|
影馳GTX285 微星GTX260+ OC版 微星9800GT綠色版 影馳9600GT刀鋒版 昂達9500GT | |
|
海盜船HX1000W | |
|
顯示器 |
Sony 40V380A |
|
軟件系統配置 | |
|
Windows 7 RTM 7600 64bit | |
|
驅動 |
Forceware 186.18WHQL |
4核8線程的Core i7可以說是當前壓片的神器了,現在已經有很多視頻相關軟件加入了對SSE4.1指令集以及HT超線程技術的優化。因此,雖然Core i7價格依然高高在上,很多人認為太高端不具代表性,但評測還是要加入的。
為了滿足讀者的要求,筆者特意選擇了目前主流四核Q9550,它的主頻比i7 920還要高一些,但價格和平臺更為便宜。此外還有最強雙核E8400,還有最受歡迎的E5300。
顯卡方面,也盡量選擇了市場上的主流產品,從高到底依次為GTX260+、9800GT、9600GT、9500GT,其中98GT和96GT都是剛上市的綠色版,主頻較低但功耗和發熱控制相當不錯。
首先還是在優異的Core i7平臺上進行測試,作為Intel新一代處理器,i7支持SSE4.1、SSE4.2指令集,對多媒體性能優化最好,而且超線程技術也能讓視頻轉碼性能提升不少。目前包括MediaShow、MediaCoder、TMPEGnc、PowerDirect在內的很多視頻編輯/轉換軟件都對i7指令集提供了優化支持。
● DVD(720×576 MPEG2)轉iPhone(480×270 H.264)MP4

9500GT確實太弱了,Badaboom使用95GT時的性能慘不忍睹,而且MediaCoder和MediaShow在開啟CUDA加速后性能不升反降,看來32SP構成了轉碼瓶頸,跟不上i7的腳步了。而96GT的64SP則完全夠用,MediaCoder和MediaShow對GPU的要求不算高,96GT以上級別的顯卡不會帶來更好的性能表現。
Badaboom主要依靠GPU加速,因此從95GT到96GT到98GT再到GTX260+都有性能提升,但提升幅度并非線性,這可能與低分辨率MPEG2編碼不夠復雜有關系。

通過CPU占用率就可以發現,Badaboom基本把CPU架空了,完全依靠GPU的SP做運算,而MediaCoder和MediaShow則是利用GPU做編碼、CPU做解碼和音頻等混合處理,因此CPU占用率很高。
MediaShow在開啟CUDA后CPU占用率下降,而MeidaCoder開CUDA后CPU占用率反而上升,而且MediaCoder在MPEG2轉碼時的性能并不比MediaShow強太多,可能是轉碼原理不同,或者是對i7超線程的支持與優化不同所致。
● H.264編碼1080p轉720p

數據量更為龐大的1080p壓720p的測試中,三款軟件的整體表現與MPEG2類似,但也有些不同,這里9500GT并沒有起到負作用,MediaCoder和MediaShow開啟CUDA后都有了些許提升,另外Badaboom換用各種顯卡后的性能提升基本與顯卡的3D性能相當,看來三款軟件只有遇到高負荷的工作時才能完全發揮出應有的實力。
MediaCoder的轉碼性能顯然是最強的,因為它不但充分利用了CPU資源,而且GPU的貢獻也不少,96GT/98GT/GTX260都有提升,性能完全超越Badaboom。而MediaShow依然是96GT以上無用,此時其性能表現還不如Badaboom使用GTX260+時。

面對更加復雜的1080p轉720p,Badaboom轉換時的占用率比MPEG2更低,而MediaCoder占用率比MediaShow高不少,可以說完全利用了i7 4核8線程的所有資源,因此轉碼速度最快。MediaShow既沒有效利用CPU資源,也沒充分發揮GPU的優勢,速度雖然也不錯但沒能取得突破。
可能有些人覺得i7性能太強,是非主流,所以我們換稍弱一點的主流775平臺,還是用四核Q9550,這顆CPU主頻比i7 920更高,但不支持SSE4.2、不支持超線程、不支持三通道,因此轉碼性能會有所損失,下面看看三款軟件在Q9550平臺上的表現。
● DVD(720×576 MPEG2)轉iPhone(480×270 H.264)MP4

雖然Q9550的主頻更高,但主要依靠CPU的MediaCoder和MediaShow轉碼速度都要比i7平臺慢一些,但還是要比主要依靠GPU的Badaboom強。

不支持超線程的話,Q9550的CPU占用率就比較穩定了,MediaCoder和MediaShow差不多。Badaboom轉碼時Q9550的占用率比i7提高不少,21%意味著Badaboom需要獨占一顆核心的資源來完成整個轉碼任務。
● H.264編碼1080p轉720p

由于Q9550性能遠不如i7 920,導致主要依靠CPU的MediaCoder和MediaShow轉碼能力下降不少,MediaShow依然是96GT以上無用,而MediaCoder則是98GT以上無用(i7平臺GTX260+依然有提升),這說明CPU速度下降時對GPU的要求也不如從前。
此時這兩款軟件被主要依靠GPU的Badaboom迎頭趕超,Badaboom對GPU的資源利用始終是最高的,筆者把GTX260+換為單核最強的GTX285后性能依然有提升(圖中Badaboom藍色成績就是GTX285,而不是CPU)。

從CPU占用率來看,軟解時MediaCoder和MediaShow不相上下,基本都充分利用了四核的資源,而開啟CUDA后,MediaCoder的CPU占用率更高一些,看來這就是其高性能的源泉,用GPU部分消除了瓶頸,然后最大限度的發揮CPU價值。
繼續降低平臺配置,從四核換成雙核,先用優異雙核E8400,它主頻不如E8500/E8600,但規格上也是最高的。雙核理論性能比四核減半,但E8400主頻要比Q9550高一些。
● DVD(720×576 MPEG2)轉iPhone(480×270 H.264)MP4

一到雙核平臺,MediaCoder和MeidaShow就性能大降,Badaboom使用98GT以上級別的顯卡就能輕松超越它們。

通過CPU占用率來看,MediaCoder和MediaShow無論軟解還是硬解,E8400都已經竭盡全力了。Badaboom性能雖強,但其在雙核平臺的占用率也不低,所以衡量其性能是一定不要忘了CPU其實也貢獻了不少。
● H.264編碼1080p轉720p

轉H.264時,Badaboom的表現更加神勇,搭配96GT以上顯卡就能輕松干掉MediaCoder和MediaShow了。

兩款主要依靠CPU轉碼的軟件出現了極大的瓶頸,雙核CPU性能有限,而GPU則很富裕,Badaboom超越它們不足為奇。
在高端雙核E8400上面,Badaboom就已經表現出了很強的實力,現在筆者就換用最受歡迎的主流E5300,E5300不僅主頻更低、二級緩存更小、前端總線有限、而且連SSE4.1指令集都不支持,此時三款軟件的表現又將如何呢?
● DVD(720×576 MPEG2)轉iPhone(480×270 H.264)MP4

包括Badaboom在內的三款軟件性能都下降不少,看來E5300和E8400比確實差很多。不過性能座次排行沒有發生太大變化,Badaboom搭配96GT以上級別顯卡就能全勝MeidaCoder和MediaShow。

由于E5300太弱,導致Badaboom的CPU占用率也居高不小,基本上一顆核心被徹底占用了,MediaCoder和MediaShow基本上就是滿載。
● H.264編碼1080p轉720p

復雜的H.264編碼,Badaboom的優勢更為顯著,性能幾乎達到了MediaCoder的兩倍。在低端平臺,誰對GPU的利用率高誰的速度就最快,因此MediaCoder還是要比MediaShow快不少。

轉H.264時,Badaboom的CPU占用率比MPEG2還要低一些,看來CUDA對H.264的優化最到位,MPEG2反而更消耗CPU資源。
前面幾頁是在相同平臺上對比不同顯卡之間的差異,現在換一種對比方式,同為高端熱門的GTX260+顯卡,搭配不同的CPU時,各款軟件之間的轉碼性能有何差異呢?


這樣的結果就更加直觀明了了,Badaboom基本上對于CPU沒有特殊要求,四核對它毫無用處,主流雙核就能滿足它。雖然E5300要比E8400差一些,但要知道E5300主頻低、緩存小、前端總線窄、不支持SSE4.1等諸多因素,相信超頻后的E5300或者E7200以上級CPU都能充分發揮Badaboom的轉碼性能。
而MediaCoder和MediaShow雖然也支持CUDA轉碼,但對GPU的利用率顯然沒有Badaboom那么高,它們只是借助GPU的力量來輔助CPU進行轉碼,很多時候96GT或98GT就能滿足它們的需要了,更強的顯卡得不到充分利用。反倒是CPU多強都不夠用,i7即便超頻后依然能做到100%滿載。
因此,在四核平臺,MediaCoder和MediaShow能夠超越Badaboom,而在雙核平臺全面敗退。
● 三款視頻轉碼軟件的速度差異分析
據了解,目前的CUDA Encoder主要模塊實際上是由NVIDIA自己編寫的,然后透過CUDA API的方式把這些模塊提供給諸如Cyberlink、Nero、BIT等公司完成軟件整合。因此在輸出碼率相近、設置相同的情況下,幾款CUDA轉碼軟件輸出視頻的畫質不會有太大區別,而且“編碼”效率也應該是差不多的。
因此,我們完全不用擔心視頻輸出畫質的問題,只關心速度就夠了。由于編碼器相同,那么轉碼軟件的速度差異就主要體現在視頻“解碼”這一環節了。

MediaCoder的視頻編碼和分辨率縮放由GPU完成,視頻解碼依然靠CPU
Badaboom使用CUDA進行解碼,因此對CPU的要求很低,如果使用高端顯卡則速度會有很大的提升;MediaCoder和MediaShow使用CPU進行軟解碼,對于CPU的依賴性非常大,由于MediaCoder還使用GPU進行分辨率縮放處理,因此對于GPU的利用率比MediaShow更高,進一步減輕了CPU的負擔消除瓶頸,速度自然更快。
也許有人會問,視頻解碼很消耗資源嗎?現在隨便一顆主流雙核都可以軟解高清視頻,解碼也會成為速度瓶頸?話是沒錯,但要知道我們平常看片是用24fps 1X普通倍速解碼視頻,此時的CPU占用率不會很高,但在視頻轉換過程中,解碼速度動輒上百幀,此時CPU資源消耗就不容小視了。轉碼速度越快、解碼所消耗的CPU資源就越高,因此解碼器效率的高低會對轉碼速度造成很大幅度的影響。
● 視頻轉碼的瓶頸在哪?CUDA加速的奧秘解析:
通過任務管理器監控MediaCoder的幾大模塊,我們就可以進一步了解CUDA是如何加速視頻轉換的。下圖就是MediaCoder在視頻轉換過程中的四大進程:
可以看到,CPU占用率最高的就是X264編碼器,達80-90%,解碼器次之10%左右,而主程序和音頻編碼器在前兩者面前幾乎就是微不足道的。
顯而易見,編碼器是視頻轉換過程最大的瓶頸,將X264編碼器換為CUDA Encoder之后,編碼器本身的CPU占用率下降不少,而解碼器的CPU占用率上升不少,也就是說編碼器節省出來不少CPU資源給解碼器用,此消彼長之后達到了一個更為合理的平衡狀態。由于GPU參與運算,消除了解碼器等待編碼器這一嚴重的瓶頸,從而使得轉碼效率大大提高。
● Badaboom是CUDA的旗桿,深入貫徹優化PC精神
比GPU利用率的話,Badaboom是無人能敵的,GPU一手包辦了視頻解碼和編碼兩大主要流程,無論多強的顯卡都有用武之地,筆者從GTX260+更換為GTX285性能還會有提升。
比相對速度的話,Badaboom在中低端雙核平臺上優秀的表現讓人拍手叫好,MediaCoder和MediaShow都不是對手。但由于Badaboom架空了CPU,導致在四核CPU平臺上(尤其是i7)的性能不如MediaCoder和MediaShow。
Badaboom的這種轉碼模式一是為了突出CUDA足以挑戰CPU的強大實力,二是帶來了一種更為經濟實惠的轉碼方案。通過Badaboom的測試我們就可以發現,高端顯卡搭配低端CPU,不但游戲性能不會受到影響,就連視頻轉碼性能也不會差很多。在預算有限的情況下,高端顯卡搭配低端CPU的組合在游戲和視頻方面的性能都是最強的——這不正是NVIDIA大力宣傳的“優化PC”的概念么!

不得不承認,Intel的Core i7在視頻編碼方面擁有非常強悍的實力,但如果沒有CUDA輔助的話,純CPU編碼的速度只能相當于Badaboom使用98GTX+級別顯卡(參考下圖)。當然Badaboom也要消耗CPU資源,將此資源折算進去的話i7也無法超越GTX260+,就算是將i7超頻也很難超越GTX285。
● MediaCoder追求最強性能:CPU+GPU異構計算
NVIDIA通過Badaboom證明了GPU及CUDA的強大,但是視頻轉碼速度卻沒有得到質的提升,也許把所有任務都交給GPU處理并不是最好的選擇,尤其是在高端平臺。
如果比絕對速度的話,使用CPU解碼、GPU編碼的MediaCoder是目前速度最快的視頻轉換軟件,它充分利用了CPU的資源,也較好的利用了GPU資源,兩者相輔相成,讓視頻轉換速度得到了飛躍式提升。這就是NVIDIA近年來最常提及的GPU+CPU異構計算的概念。
異構計算是指系統內不同的運算部件負責各自擅長的計算,從而達到非常好的的運算效率。在視頻轉碼領域,如果能讓CPU和GPU的所有資源都達到100%滿負荷運行,那么性能肯定是最高的,目前來看,無論Badaboom、MediaCoder還是MediaShow都沒能實現,相對來說MediaCoder是做的最好的,相信隨著CUDA編碼器和軟件優化不斷完善、進一步平衡算法,視頻轉碼速度還能更上一層樓!
相關評測文章推薦:
20分轉1部藍光!國產CUDA轉碼軟件首測
MediaCoder與Badaboom詳細介紹與畫質對比請看本文
CUDA正面對決Stream!MediaShow詳測
MediaShow詳細介紹,CUDA與Stream速度對比請看本文
高清播放再次革命!CUDA解碼方案評測
CUDA解碼與PureVideo解碼的優勢全面解析<
關注我們


