泰坦神器降臨!NVIDIA GTX TITAN測試
Kepler GK110專為NVIDIA Tesla打造,其目標是成為世界上并行計算性能最高的微處理器。GK110 不僅大大超過由 Fermi 提供的原始計算能力,而且非常節能,顯著減少電力消耗,同時產生的熱量更少。完整 Kepler GK110 實施包括 15 SMX 單元和六個 64 位內存控制器。不同的產品將使用GK110 不同的配置。例如,某些產品可能部署 13 或 14 個 SMX。在下面進一步討論的該架構的主要功能,包括:
1、新 SMX 處理器架構
2、增強的內存子系統,在每個層次提供額外的緩存能力,更多的帶寬,且完全進行了重新設計,DRAM I/O 實施的速度大大加快。
3、貫穿整個設計的硬件支持使其具有新的編程模型功能
Kepler GK110 完整芯片框圖
Kepler GK110 支持新 CUDA Compute Capability 3.5。(有關 CUDA 的簡介請參考附錄 A ‐CUDA 快速回顧)。下表對比了 Fermi 和 Kepler GPU 架構的不同計算能力的參數:

Fermi和Kepler GPU的計算能力
性能/功率比
Kepler架構的一個主要設計目標是提高電源效率。設計Kepler時,NVIDIA工程師應用從Fermi中積累的經驗,以更好地優化Kepler、實現高效運行。臺積電的 28nm 制造工藝在降低功耗方面起著重要的作用,但許多 GPU 架構需要修改,以進一步降低功耗,同時保持出色的性能。
Kepler每一個硬件設備都經過設計和擦洗,以提供卓越的性能/ 功率比。出色性能/功率比的非常好的案例是Kepler GK110新流式多處理器 (SMX) 中的設計,與最近Kepler GK104引入的 SMX 單元的許多方面類似,但計算算法包括更多雙精度單位。
關注我們


