獨家5核心設計!Tegra3規格性能全解析
泡泡網顯卡頻道11月9日 今年是平板電腦市場蓬勃發展的一年,原本相對傳統的筆記本、顯示器甚至是板卡廠商幾乎大部分都加入了平板陣營,可見平板電腦在今年的魅力。平板電腦在很多時候需要較強的處理能力,尤其是iPad的發展,讓眾多廠商了解到平板電腦必須有更好的處理器才能好玩,所以對于平板電腦來說也同樣需要一顆“良芯”。
當2009年NVIDIA推出Tegra平臺的時候并沒有引起過多注意。當年的Tegra平臺雖然普遍被業內人士看好,不過對于通信市場來說還是太過于生澀,后來當Tegra2平臺出現的時候NVIDIA已經開始在全球部署GPU戰略,而這一次終于引起了國際廠商的興趣。
憑借全新的設計理念,NVIDIA的Tegra2在今年年初的CES上可謂是出盡了風頭。各廠商所推出的基于Tegra2的各種移動便攜設備,也成為人們所關注的焦點。今天第三代采用了全新設計架構的Tegra產品已經發布,該產品究竟加入了哪些突破性技術呢?性能和功耗又將如何呢?下面小編就為大家詳細介紹。
NVIDIA Tegra系列產品的發布日期一般都是每年出一款新品,前兩代Tegra 都是在CES消費電子展上發布。在今年的CES上NVIDIA只是和大量合作伙伴展出了大量采用Tegra2核心的設備,并沒有提Tegra3的事兒,著實讓大家吊足了胃口。終于等到今年的臺北電腦展,黃仁勛才首次對媒體演示Tegra3的工程樣品。
Tegra3單核最高主頻可達到1.4GHz,多核主頻為1.3GHz。Tegra3是首款采用vSMP可變對稱多重處理專利技術的移動SoC設備,該技術不僅可以最大限度降低活動待機狀態下的功耗,而且還能夠根據需要實現最強勁的四核性能。除了四個主要的Cortex A9高性能CPU核心以外,還擁有第五個低功耗、低漏電Cortex A9 CPU核心。它叫做CPU“協”核心,經過了專門的優化,可最大限度降低活動待機狀態下的功耗,處理這些不那么耗資源的處理任務。
Tegra3還包含其它的vSMP專利技術,這些技術可根據應用程序以及操作系統的要求,智能地管理主核心以及協核心之間的工作負荷調度。這種管理由NVIDIA的動態電壓與頻率擴展(DVFS)以及CPU熱插拔管理軟件實現,不需要對操作系統進行專門的改動。
協核心是利用低功耗工藝技術設計而成的,然而卻擁有同主核心相同的內部架構。因為它是利用低功耗工藝技術制造的,以低性能模式運行,所以它的功耗低于這些采用高速工藝技術制造的主CPU核心。在Tegra3處理器上測得的性能功耗比顯示,協核心在500MHz以下工作時可實現高于主核心的每瓦特性能。因此協核心的最高工作頻率不高于500MHz。
與協核心不同,CPU主核心需要以極高的頻率運行才能實現高性能。因此它們是利用高速工藝技術制造而成的,這種工藝技術讓主核心能夠在較低的工作電壓下將工作頻率提升至極高的水平,因此主核心能夠在不大幅增加動態功耗的情況下實現高性能。
vSMP技術通過利用協核心最大限度降低活動待機狀態下的漏電功耗,同時利用四個主核心最大限度降低峰值工作頻率下的動態功耗,從而可大幅降低整體功耗。根據使用場合,vSMP技術能夠動態地啟用和關閉CPU核心,從而在盡可能低的功耗下實現想要的性能。
人們有一個常見的誤區,認為多核CPU比單核CPU功耗更高,而且會大幅縮短電池續航時間。相反,由于可變對稱多重處理,Tegra3中的四個主核心CPU架構更加節能,而且其性能功耗比高于競爭的單核以及雙核處理器。
為了滿足多任務處理環境中的峰值性能需求,單核CPU不僅要在高于多核CPU的時鐘頻率和電壓下運行,而且完成指定任務需要花費更長的時間。多核CPU能夠利用對稱多重處理以及將工作負荷分配給多個CPU核心的辦法。由于工作負荷被多個核心分擔,因此在完成一個多線程任務或者多個任務時,每一個CPU核心均能夠在更低的頻率和電壓下運行。而且,由于工作頻率和電壓更低,因此每個核心的功耗均遠低于單核CPU,而性能功耗比則遠高于單核CPU。
在基于四核CPU的系統上,操作系統將能夠在四個CPU核心之間分配諸多網頁腳本,從而讓含有大量JavaScript的網頁執行速度大幅提升。Moonbat是一款基于Web的JavaScript基準測試程序,該程序的測試結果顯示,與基于雙核CPU的移動處理器相比,四核CPU幾乎可實現50%的網絡瀏覽性能提升。
多核處理器的一個重要優勢是能夠為高要求應用以及使用場合提供更強的性能。基于四核CPU的Tegra3不僅能夠為應用提供更高的性能,而且還讓開發者能夠打造出前所未有、更加引人入勝的移動設備應用程序。
Coremark是一款流行的移動CPU基準測試程序,該程序的測試結果充分體現了運行多媒體應用時的性能情況,這些應用極耗CPU資源。Coremark顯示四核CPU的性能幾乎是雙核CPU移動處理器的2倍、幾乎是單核CPU的4倍。
媒體應用的并行機制十分顯著,例如圖像處理、音頻/視頻轉碼以及文件壓縮等等。這些應用可以利用對稱多重處理以及多核CPU。由于大多數移動設備均包含一個或多個攝像頭,因此圖像處理在移動設備上已經成為一種常見的應用。
Photaf 3D Panorama就是一款評價很高的Android應用程序,該程序讓用戶能夠自動拍攝3D全景照片并將捕捉到的圖像拼接起來以備即時查看。在檢測邊緣以及拼接圖像的過程中會涉及大量圖像處理,性能測試結果顯示,Tegra3在處理和顯示所捕捉的全景圖像方面幾乎比雙核CPU移動設備快2倍。
Linpack是一款為人們廣泛使用的CPU基準測試程序,當處理器運行媒體處理等極耗CPU資源的任務時,該程序可以很好地測量處理器性能。多線程Linpack基準測試程序的測試結果顯示,Tegra3的性能幾乎比同等雙核處理器高出60%。專為四核處理器而優化的實際應用程序在四核處理器上能夠實現更大的性能提升。
媒體轉碼是另一個得益于多重處理的使用場合。移動用戶通常利用其手機來捕捉和編輯音頻以及視頻文件,之后再與友人分享以及在社交網絡上分享這些內容。
Handbrake是一款流行的視頻轉碼應用程序,與雙核CPU系統相比,該程序在四核CPU系統上可大幅提升轉碼速度。在運行Handbrake視頻轉碼任務時,四核CPU的性能幾乎能夠實現60%的性能提升。
當今的大多數游戲引擎均支持多線程,例如Unreal3.0、Id Tech 5以及Frostbite等等,而且游戲引擎正越來越多地移植到任務處理模型上來,在這種模型中,單個工作的“尺寸”得到了縮減,而線程的數量則實現了增加。這些線程用于諸多任務,例如音頻、碰撞檢測、人工智能、用戶輸入處理、游戲策略以及網絡通信等等。所有現代游戲平臺均支持多線程,而未來的平臺將繼續這一趨勢。
由于四核處理器能夠實現更高的性能,因此移動游戲現在可以具備先進的游戲特性,例如實時物理效果以及實時紋理生成。如此一來,移動游戲的圖像質量便得到了大幅提升、玩家也能夠獲得更加逼真的游戲體驗。
● 實時物理效果增進逼真度
當物理世界的碰撞、風、水、重力、運動等元素運用在虛擬游戲世界中時,我們自然希望這些元素的表現與在物理世界中如出一轍。這些基于游戲中玩家行為以及現實世界規律的效果,進一步提高了游戲的逼真度,使得游戲更加身臨其境和引人入勝。
在Tegra3上,動態照明、物理效果、人工智能的處理任務以及其它與游戲相關的CPU處理通過四個核進行共享。通過這種負載共享,沒有哪一個核會過載,并且處理器仍有額外的處理空間用來處理后臺任務,絲毫不會影響到用戶體驗。
● 實時動態紋理生成
移動游戲的復雜性和視覺上的豐富程度在不斷增加,同時可下載游戲內容的文件大小相應劇增。 游戲文件往往太大,下載游戲的時間超過十五分鐘,導致用戶購買游戲后如果不喜歡該款游戲將要求退款。這不僅讓買家感到失望,也致使買家失去購買需要下載大文件的高級游戲的動力。
實時動態紋理生成技術允許游戲開發者編寫游戲代碼,以使游戲中所需的紋理根據游戲的情節和狀態實時創建。由于是即時生成紋理的,因此不必在購買時提供。通過這項技術,游戲開發者可以將游戲文件的大小減小幾個數量級。
動態文理生成的另一個關鍵好處在于可以通過對游戲編碼,使游戲中的環境根據玩家的輸入和自定義相應改變。例如,可以為玩家提供改變游戲中的天氣的選項,根據選擇的天氣情況動態生成影響場景的相應紋理。這種技術能提供高度互動的游戲體驗,而且不會明顯增加游戲文件大小或編碼復雜度。
實時生成這種大型紋理集要求具備強大的CPU處理能力,這是單核和雙核移動處理器所無法提供的。在雙核移動處理器上生成實時紋理將使兩個處理核過載,導致游戲體驗欠佳。而四核移動處理器不僅能輕松處理這個任務,而且能提供足夠的空間來在后臺處理其它任務。
NVIDIA在每次發布新顯卡時都會公布一些美輪美奐的演示DEMO。后來NVIDIA將這一良好的傳統延續到了移動計算產品線上來了。在今年的ComputeX展會上,NVIDIA就提前展出了下一代的Tegra3產品,而且為Tegra3量身打造了多款非常震撼的3D演示以及游戲,下面讓我們回顧一下。
第一款是純技術型演示Demo,風格與當年GeForce 4/FX時代的Demo比較接近,但被加入了最新潮的PhysX技術。靚麗的光影效果搭配逼真的物理交互動作,畫面完全可媲美桌面3D游戲,讓人嘆為觀止!



小球與背景華麗的HDR光照效果和陰影投射、布料的物理加速以及和小球碰撞時的交互是最大的看點。另外注意左下角的CPU占用率,Tegra3的四顆核心幾乎全部滿載,這個演示Demo將Tegra3的性能全部發揮出來了。
第二個演示游戲前幾天我們已經報道過了,就是PC上的DX11大作《失落星球2》,目前已經有開發中的Android版本了,由于畫面精美對配置要求很高,只有Tegra3才能跑得動。雖說這款游戲是卡普空的作品,但幾乎可以說是為NVIDIA Tegra3量身定做的:



玩過PC版《失落星球2》的朋友應該很熟悉了,這段畫面正是該游戲的片頭動畫,為實時演算的3D畫面。我們知道PC版是DX11引擎,而Tegra3版本則采用了OpenGL引擎渲染,其畫面除了分辨率較小意外,和PC版很難看出來有什么區別了。
第三個演示Demo就沒有必要特別說明了,暴力型純物理效果展示,不停的推倒各種墻,展示出真實世界中摧毀交互效果:



據了解,Tegra3并不支持GPU物理加速,其物理效果完全是由四顆ARM CPU核心算出來的。因為在玩游戲的時候CPU基本空閑,讓CPU做物理加速可以最大化性能表現。
最后一款演示Demo更加神奇,相信發燒游戲玩家看起來也更親切,先看圖吧:




這不就是PC上第一款DX11 Benchmark——Heaven(天堂)嗎?這款演示Demo大量使用了Tessellation(曲面細分)技術,是AMD和NVIDIA教科書式的DX11演示。作為Tegra3的演示Demo,這款“山寨版天堂”演示的畫面也是相當精美,但是NVIDIA也并未透露更多的細節。
早在多年以前,桌面CPU就已經開始從單核CPU架構向雙核和四核架構轉變。但直至幾年前,廣大用戶才開始領會到多核CPU真正的好處。這是因為除了在多個核上執行多種不同應用程序的多任務之外,能夠運用多核CPU的真正多線程瀏覽器和應用程序是在推出多核CPU之后幾年才實現的。今天的桌面PC正在見證著多核CPU帶來的諸多益處。
而在移動領域,從單核CPU向多核CPU的過度將更快,這是因為移動軟件系統是在桌面領域的既有成果之上進化來支持多核移動CPU的。廣為使用的移動軟件已提供對多任務和多線程的支持。
由于移動游戲發展迅猛,開發者正將受歡迎的PC和游戲機游戲引擎移植到移動環境。這些游戲引擎最初是針對多核桌面PC而開發的,因此也將在移動處理器中利用多核CPU,為移動游戲玩家帶來立竿見影的好處。四核CPU為游戲開發者提供了強大的處理能力,將使開發者具備高級的物理效果、人工智能、碰撞檢測/避免、虛擬紋理、更好的聯網游戲等。■<
關注我們


