國(guó)產(chǎn)14nm AI芯片算力已可媲美英偉達(dá)4nm芯片?
近日,在北京ICC全球CEO峰會(huì)上,中國(guó)半導(dǎo)體行業(yè)協(xié)會(huì)副理事長(zhǎng)魏少軍拋出了一枚震撼彈:一款采用成熟14nm制程與18nm DRAM的國(guó)產(chǎn)AI芯片,竟聲稱能夠媲美NVIDIA的4nm GPU!這一說(shuō)法雖顯得頗為科幻,但它卻代表了國(guó)內(nèi)AI戰(zhàn)略的最新進(jìn)展。這款芯片利用3D混合鍵合與近內(nèi)存計(jì)算架構(gòu),試圖打破對(duì)NVIDIA CUDA(統(tǒng)一計(jì)算架構(gòu))的依賴。
魏少軍詳細(xì)介紹了這款芯片的技術(shù)亮點(diǎn):它將14nm的AI芯片與18nm的DRAM進(jìn)行堆疊鍵合,并采用3D混合鍵合技術(shù)實(shí)現(xiàn)銅對(duì)銅的超高密度連接,從而顯著提高了內(nèi)存帶寬并降低了運(yùn)算延遲。傳統(tǒng)封裝方式通常面臨“內(nèi)存墻”瓶頸——AI訓(xùn)練過(guò)程中頻繁的數(shù)據(jù)存取導(dǎo)致能量和時(shí)間成本高昂;而這種新架構(gòu)則使得邏輯運(yùn)算緊貼內(nèi)存執(zhí)行,軟件定義的邏輯可以更動(dòng)態(tài)地改善AI工作負(fù)載。
此外,魏少軍還透露了這款國(guó)產(chǎn)14nm AI芯片的性能數(shù)據(jù):每瓦達(dá)2 TFLOPS(每秒萬(wàn)億次浮點(diǎn)運(yùn)算)的能效,總吞吐量高達(dá)120 TFLOPS,遠(yuǎn)超NVIDIA的A100 GPU。然而,通過(guò)網(wǎng)絡(luò)查閱資料顯示,NVIDIA A100 GPU的性能高達(dá)312 TFLOPS,顯然超出了國(guó)產(chǎn)AI芯片的性能水平。因此,盡管這款國(guó)產(chǎn)芯片在某些方面展現(xiàn)出潛力,但要真正挑戰(zhàn)國(guó)際大廠,仍然需要更多的努力。
總的來(lái)說(shuō),這款國(guó)產(chǎn)AI芯片的推出代表了中國(guó)半導(dǎo)體行業(yè)在AI領(lǐng)域的技術(shù)進(jìn)步,未來(lái)如果能夠不斷優(yōu)化并提高性能,將有望為全球AI計(jì)算領(lǐng)域帶來(lái)更具競(jìng)爭(zhēng)力的選擇。
關(guān)注我們


