DX11性價比之王!GTX460雙雄權威評測
第二章/第三節 GF104專為游戲玩家設計:刪除顯存ECC、去掉雙精度運算
GF100核心當中有很多功能都是普通用戶根本用不到的,比如顯存ECC、雙精度浮點運算和CUDA C++指令,這些技術和功能是NVIDIA為專業用戶而定制的。
● GF104刪除顯存ECC功能
GF100核心是第一顆在顯存中提供了基于糾錯碼(ECC)數據保護功能的GPU。GPU計算用戶使用ECC來在高性能計算環境中增強數據完整性。ECC是諸如醫療成像以及大型集群計算等領域中一個迫切需要的特性。
顯存ECC可以減少數據運算出錯的幾率,而對于圖形渲染來說,算錯幾個像素可能無傷大雅。所以GTX480系列都沒有用到顯存ECC功能,目前還只有Tesla系列支持顯存ECC,備受超級計算數據中心的親睞。
定位較低的GTX460就更不需要顯存ECC功能了,所以在GF104核心設計之初就直接被刪除。
● GF104精簡雙精度浮點運算能力
GF100相對于以往的GPU,大幅度改進了雙精度浮點運算能力,其效率達到了單精度浮點運算的1/2,而ATI全系列顯卡是1/5,NV上代顯卡是1/8。目前尚不清楚GF104核心到底是完全刪除了雙精度運算單元、還是降低了雙精度運算效率。無論是哪種方式,對于普通用戶來說都沒有任何影響,因為所有的3D圖形渲染和民用CUDA軟件都不會用到雙精度運算。
NVIDIA稱,沒有計劃使用GF104核心來制造Tesla GPU計算產品,事實上此前的Tesla都使用的是高端GPU。GF104是專門針對普通用戶和游戲玩家而設計的,并沒有“一心二用”的去兼顧HPC市場。
● GF104核心的二級緩存容量為512KB,與Cypress相等
GF100的二級緩存容量為768KB,GF104減少至512KB。如果平均下來GF100的每顆CUDA核心可以分到1.5KB的緩存,而GF104的每顆CUDA核心可以分到1.33KB的緩存,新核心的緩存配比略有減少。
二級緩存和顯存控制器是關聯的
不過即便如此,GF104核心512KB的L2容量也與ATI優異的Cypress相等。此外二級緩存容量還是與顯存控制器有一定的關聯關系。其中GTX460 1GB 256Bit的版本,L2可以使用全部的512KB,而768MB 192bit的版本只能使用到384KB L2。
GF100的緩存架構讓各流水線之間可以高效地通信,減少了顯存讀寫操作
緩存容量的減少,或多或少的會影響GPU的性能,3D圖形渲染也會有損失。但GF104繼承了GF100共享式的二級緩存設計,緩存利用率非常高,即便緩存容量遭到了縮水,也要比ATI獨享式二級緩存(L2綁定顯存控制器)的效率高。其原理大家可以參照CPU領域奔騰雙核與速龍2系列的性能表現即可。
關注我們



