英特爾45nm新旗艦四核QX9650解析測試
據了解,SSE4將分為4.1版本及4.2版本,4.1版本將會首次出現于Penryn處理器中,共新增47條指令,主要針對向量繪圖運算、3D游戲加速、視像編碼加速及協同處理加速動作,包括:
Penryn SSE4 Instruction summary | ||
Instruction Category | Instructions | Benefits |
Packed DWORD Multiplies | PMULLD, PMULDQ | 提升編譯器矢量運算效能 |
Floating Point Dot Product | DPPS, DPPD | 3D立體制作及游戲,支持CG及HLSL等語言 |
Multi-packed sum of absolute diffs& min pos | MPSADBW, PHMINPOSUW | 視頻編碼處理 |
Streaming Load | MOVNTDQA | 視頻編碼處理、繪圖及GPU數據分享 |
Floating Point Round | ROUNDPS, ROUNDSS, ROUNDPD, ROUNDSD | 視頻編碼處理 、繪圖、影音處理、2D/3D應用、多媒體及游戲等 |
Packed Blending | BLENDPS, BLENDPD, BLENDVPS, BLENDVPD, PBLENDVB, PBLENDDW | 編譯器矢量運算及影音處理、多媒體、游戲等應用 |
Packed Integer Min and Max | PMINSB, PMAXSB, PMINUW, PMAXUW, PMINUD, PMAXUD, PMINDS, PMAXSD | |
Register Insertion/Extraction | INSERTPS, PINSRB, PINSRD, PINSRQ, EXTRACTPS, PEXTRB, PEXTRD, PEXTRW, PEXTRQ | |
Packed Format Conversion | PMOVSXBW, PMOVZXBW, PMOVSXBD, PMOVZXBD, PMOVSXBQ, PMOVZXBQ, PMOVSXWD, PMOVZXWD, PMOVSXWQ, PMOVZXWQ, PMOVSXDQ, PMOVZXDQ | |
Packed Test & Set | PTEST | |
Packed Compare for Equal | PCMPEQQ | |
Pack DWORD to Unsigned WORD | PACKUSDW | |
● SSE4 :向量、浮點運算專門化 加入串流式負載指令
在應用SSE4指令集后,Penryn增加了2個不同的32Bit向量整數乘法運算支持,引入了8 位無符號 (Unsigned)最小值及最大值運算,以及16Bit 及32Bit 有符號 (Signed) 及無符號運算,并有效地改善編譯器效率及提高向量化整數及單精度代碼的運算能力。同時,SSE4 改良插入、提取、尋找、離散、跨步負載及存儲等動作,令向量運算進一步專門化。
SSE4加入了6條浮點型點積運算指令,支持單精度、雙精度浮點運算及浮點產生操作,且IEEE 754指令 (Nearest, -Inf, +Inf, and Truncate) 可立即轉換其路徑模式,大大減少延誤,這些改變將對游戲及 3D 內容制作應用有重要意義。
此外,SSE4加入串流式負載指令,可提高以圖形幀緩沖區的讀取數據頻寬,理論上可獲取完整的快取緩存行,即每次讀取64Bit而非8Bit,并可保持在臨時緩沖區內,讓指令最多可帶來8倍的讀取頻寬效能提升,對于視訊處理、成像以及圖形處理器與中央處理器之間的共享數據應用,有著明顯的效能提升。
◎ 實測SiSoftware Processor Multi-Media

從測試結果看,多媒體運算能力上QX9650只比QX6850高出一點,優勢不是很明顯,普通消費者在使用時并不能體會出區別,只能使用專門軟件才能區別開。
◎ Cinebench圖形渲染測試

CINEBENCH RELEASE 10主要考察處理器在進行圖形渲染任務時的性能,并且支持多線程的軟件。此次測試中QX9650比QX6850提高9%,顯示出新款45nm處理器擁有超強的圖像處理器能力
關注我們


