完美DX10!ATI新王者HD2900XT權威評測
ATI從R520到R580核心,將像素渲染單元翻了三倍之多,但紋理單元的數量和性能沒有改進,因為ATI認為今后的游戲中紋理操作指令并沒有增多,而且所占比重逐年下降。到了DX10時代,ATI為R600設計了恐怖的320個流處理器,那么紋理單元有何變化呢?
第四章\\第七節 Texture Units(紋理單元)
首先來看看R600的對手——G80在紋理單元部分有些類似于傳統的管線式架構,只不過傳統GPU是每個ALU綁定TMU,而G80是每組流處理器(16個)陣列綁定一組TMU&L1&L2,這種架構非常靈活,也很容易衍生出一系列產品。
G80的8組Shader陣列綁定了紋理單元和L1/L2緩存與G80每組流處理器陣列綁定紋理單元&緩存不同,R600的紋理單元與流處理器部分是分開的,都受到Thread Processor的統一調度,這種架構沿用R520/R580的設計,但在結構部分改動特別大。
R600的紋理單元及緩存部分R600擁有4個紋理單元(R580也是4個,4×4結構),但在每個紋理單元內部包含了8個紋理尋址單元(黃色,共32個,R580的2倍),20個32位浮點紋理采樣單元(橘黃色,共80個,R580的5倍),和4個紋理過濾單元(深紅色,共16個,與R580相等)。

R600單個紋理單元的內部結構再來看看細節部分,可以看到8個黃色的紋理尋址單元和20個FP32紋理采樣單元還要區分大小,這是因為頂點著色只能使用到其中4個小紋理尋址單元進行紋理采樣,而像素/幾何著色則可以使用全部的8個;頂點著色只能使用其中4個小FP32紋理采樣單元,而像素/幾何著色則可以使用全部的20個。
可能很多人都比較奇怪R600怎么會有這么多的FP32紋理采樣單元,這是因為Shader Mode 4.0只能支持128Bit色彩精度(IEEE FP32)紋理采樣,而且Textures和Samplers現在是各自獨立的,程序會大量使用Sampler指令,因此獨立、大規模的FP32紋理采樣單元可以大幅提升紋理貼圖效率和高分辨率紋理精度。
● 紋理單元特性:
FP16 HDR紋理全速雙線性過濾(X1000系列的7倍)
FP32浮點紋理半速過濾
支持所有格式的三線性和各項異型過濾
驅動默認高品質各項異型過濾
軟邊陰影著色性能提高
支持分辨率高達8192×8192的紋理貼圖
Fetch4紋理樣本過濾器,采樣速度提升四倍
關注我們


