非GPU路線的AI芯片國產(chǎn)化:ASIC、存算一體和RISC-V如何突破存儲、能耗、編譯三座大山?

2025China.cn   2025年01月16日

【摘要】存儲墻、能耗墻、編譯墻,是AI芯片領(lǐng)域長期面臨的三座大山。在缺乏足夠先進(jìn)制程的情況下,國產(chǎn)AI芯片的非GPU路線尤為重要。

ASIC需求先行,但卻面臨著專用架構(gòu)難以適配算法需求的飛速迭代的巨大挑戰(zhàn),燧原當(dāng)前便因架構(gòu)調(diào)整上的困難導(dǎo)致研發(fā)進(jìn)度并不迅速。

存算路線基于 SRAM、DRAM、RRAM 等不同存儲介質(zhì),使存儲單元兼具計(jì)算功能,大幅削減數(shù)據(jù)搬運(yùn)量,降低延遲和功耗。蘋芯科技在端側(cè)布局,于2024年成功點(diǎn)亮其PIMCHIP-S300多模態(tài)智能感知芯片

RISC-V路線完全開源,但場景缺失、生態(tài)難用,使得希計(jì)算等公司面臨著找到下游需求、完善生態(tài)提升兼容的考驗(yàn)。

越來越多供應(yīng)鏈廠商的配合,將很快提到前所未有的高度。

以下是正文:

美國的全球“AI芯片禁令”越來越聳人聽聞,到了讓英偉達(dá)都反對的地步。

但服務(wù)器、端側(cè)AI芯片的下游需求卻并未因此而消退,一眾新舊勢力都盯上了此時(shí)的關(guān)鍵機(jī)會。

除了傳統(tǒng)英偉達(dá)式的暴力攻堅(jiān),ASIC、存算一體、RISC-V 等非 GPU 路線的創(chuàng)新方向,也正為國產(chǎn)芯片開辟出多條具備潛力的突圍之路。

01

ASIC 路線:以燧原科技為例

與通用芯片不同,ASIC從設(shè)計(jì)之初便聚焦于某一狹窄領(lǐng)域的應(yīng)用,將所有資源與設(shè)計(jì)精力都傾注于優(yōu)化該特定任務(wù)的執(zhí)行效率。

而在缺芯潮之后,不少AI芯片創(chuàng)業(yè)公司也選擇在ASIC上攻堅(jiān),燧原科技便是其中代表。

性能上,ASIC 能夠甩掉通用芯片為兼顧多種任務(wù)而背負(fù)的冗余包袱,針對對應(yīng)AI算法進(jìn)行優(yōu)化,提升計(jì)算單元、存儲結(jié)構(gòu)等硬件組件與特定任務(wù)的契合度。

功耗上,ASIC避免了通用芯片在執(zhí)行不同任務(wù)時(shí)因頻繁切換模式、啟動(dòng)冗余模塊而產(chǎn)生的額外功耗,實(shí)現(xiàn)了每瓦特電力消耗下更高的計(jì)算產(chǎn)出,這對于數(shù)據(jù)中心等AI芯片大規(guī)模部署的場景來說無疑具備極大價(jià)值。

可靠性上,相較于復(fù)雜的通用芯片,ASIC內(nèi)部潛在的故障點(diǎn)大幅減少,且在特定應(yīng)用環(huán)境下可以針對溫度、電磁干擾等因素進(jìn)行專門的防護(hù)設(shè)計(jì)優(yōu)化,確保芯片在長時(shí)間、高強(qiáng)度的工作負(fù)載下穩(wěn)定運(yùn)行。

以上一切優(yōu)勢,均源于ASIC的本質(zhì)特點(diǎn)——需求先行。

不過,頗有意思的是,需求先行實(shí)際是一把雙刃劍,也很有可能成為ASIC路線在商業(yè)化過程中的致命傷。

在算法進(jìn)步速度和路線方向改變很大的當(dāng)今時(shí)代,從發(fā)現(xiàn)客戶需求到實(shí)際量產(chǎn)芯片產(chǎn)品這1.5-2年的時(shí)間差,這意味著,專有化芯片產(chǎn)品極有可能在剛剛完成時(shí)才發(fā)現(xiàn),其實(shí)際要支持的算法已然被淘汰。

而這正是ASIC需要回答的靈魂之問——如何在尚且沒有產(chǎn)品證明自身技術(shù)實(shí)力的時(shí)候深度綁定大客戶需求,同時(shí)做好工具鏈等生態(tài)適配。

舉例而言,AMD創(chuàng)業(yè)班底出身的燧原,手握強(qiáng)工程能力,但據(jù)知情人士透露,也由于過早固化了AI算法和框架,導(dǎo)致此前設(shè)定的一些過于專用的路線與當(dāng)下算法匹配不能跟上演進(jìn)速度。

基于此,選擇ASIC路線是一條風(fēng)險(xiǎn)較大的道路,留給產(chǎn)品定義和戰(zhàn)略預(yù)判的容錯(cuò)率并不高。

02

存算路線:以蘋芯科技為例

傳統(tǒng)架構(gòu)中,數(shù)據(jù)需在計(jì)算單元與存儲單元之間頻繁奔波,大量時(shí)間與能耗耗費(fèi)在數(shù)據(jù)搬運(yùn)路上,制約芯片性能提升。

存算一體技術(shù)則反其道而行之,基于 SRAM、DRAM、RRAM 等不同存儲介質(zhì),通過設(shè)計(jì)存儲陣列與計(jì)算邏輯,使存儲單元兼具計(jì)算功能,大幅削減數(shù)據(jù)搬運(yùn)量,降低延遲。

性能上,存算一體芯片避免了傳統(tǒng)架構(gòu)因數(shù)據(jù)傳輸帶寬受限導(dǎo)致的性能瓶頸,優(yōu)勢在于以更快速度處理 AI 任務(wù),實(shí)時(shí)響應(yīng)能力相對出眾。

能效上,由于數(shù)據(jù)搬運(yùn)大幅減少,功耗隨之驟降,相同功耗下可完成更多計(jì)算任務(wù),能效比提升數(shù)倍甚至數(shù)十倍,這對于能耗敏感的移動(dòng)設(shè)備等端側(cè)場景來說價(jià)值匪淺。

無論是在端側(cè)還是在云側(cè),存算一體路線都頗受重視。

億鑄科技、蘋芯科技是國產(chǎn)化AI芯片存算一體路線的代表,其中蘋芯科技成立于2021年,聚焦于端側(cè)設(shè)備;億鑄科技則是成立于2020年,聚焦于云側(cè)數(shù)據(jù)中心場景。

據(jù)悉,蘋芯的PIMCHIP-N300存算一體 NPU已完成開發(fā)并完成客戶交付,專為機(jī)器學(xué)習(xí)與 AI 推理任務(wù)量身打造,采用創(chuàng)新軟硬融合架構(gòu),單核提供0.5TOPS算力,看似不高卻能精準(zhǔn)滿足眾多端側(cè)場景需求,系統(tǒng)功耗低至25-100mW,典型靜態(tài)功耗僅10μW,且支持12大類超100種算子,適配各類復(fù)雜模型。

PIMCHIP-S300多模態(tài)智能感知芯片則是基于SRAM存算一體技術(shù),單核能效比高達(dá)27TOPS/W,特定計(jì)算節(jié)能 90%,大幅延長設(shè)備續(xù)航,降低部署成本,目前已進(jìn)入回片測試階段,成功點(diǎn)亮功能并完成相關(guān)方案搭建。

此外,蘋芯團(tuán)隊(duì)也在推進(jìn)大模型推理加速專用芯片研發(fā)工作,以存算一體技術(shù)為核心打造基于成熟制程的AI大模型推理加速芯片與系統(tǒng),旨在打造成本與性能遠(yuǎn)超當(dāng)前主流產(chǎn)品的大模型推理方案。

在市場經(jīng)營策略上,蘋芯科技聚焦智能穿戴、安防、智能家居等端側(cè)細(xì)分領(lǐng)域,與華為、小米、??低暤阮^部企業(yè)緊密合作,快速嵌入客戶產(chǎn)品生態(tài),專為其開發(fā)存算一體解決方案。

后續(xù)要適應(yīng)AI算法、面向大模型部署,存算一體路線需要關(guān)注的重心在于解決編譯和生態(tài)兼容的難題。

03

RISC-V路線:以希姆計(jì)算為例

業(yè)界普遍認(rèn)為,走RISC-V路線攻克AI芯片的各個(gè)國家參與者,都站在同一起跑線上。

RISC-V因其具有的可擴(kuò)展性、可編程性、超大規(guī)模等優(yōu)勢與AI大模型高度適配,而由于其完全開源的特性,成了當(dāng)前最有希望實(shí)現(xiàn)完全自主可控的路線之一。 

希姆計(jì)算是國內(nèi)最早基于RISC-V做數(shù)據(jù)中心芯片設(shè)計(jì)的企業(yè),成立于2019年4月,公司主要專注于研發(fā)以RISC-V指令集架構(gòu)為基礎(chǔ)的AI芯片DSA處理器,同時(shí)疊加大算力NPU,主攻數(shù)據(jù)中心、服務(wù)器等場景的云端大卡。

2024年底,搭載著希姆計(jì)算基于RISC-V開源指令集完全自主研發(fā)的大算力人工智能ASIC芯片的千卡集群正式點(diǎn)亮,也意味著國內(nèi)RISC-V+AI技術(shù)正在逐漸成熟。

但從數(shù)年的發(fā)展路徑來看,希姆計(jì)算從業(yè)內(nèi)唯一一家在頭部互聯(lián)網(wǎng)公司進(jìn)行業(yè)務(wù)部署的云端AI推理芯片公司,發(fā)展到如今主要依賴智算中心來撐起營收,宏圖似乎并沒有業(yè)內(nèi)預(yù)想的那么大。

除了公司內(nèi)部經(jīng)營的彎彎繞繞,希姆計(jì)算面臨著所有RISC-V企業(yè)都要面臨的致命問題——場景缺失。

由于RISC-V芯片完全開源,不需要采購?fù)夤┘軜?gòu)和IP,許多需要大規(guī)模用到RISC-V AI芯片的大廠完全有能力進(jìn)行自主開發(fā),而不需要向芯片設(shè)計(jì)公司求助。

基于此,在服務(wù)器和數(shù)據(jù)中心場景,RISC-V成了一個(gè)看似火熱但卻缺乏足夠生存空間的生意。

04

尾聲

在缺乏足夠的先進(jìn)制程節(jié)點(diǎn)的情況下,國產(chǎn)AI芯片的非GPU路線尤為重要。

當(dāng)然,一個(gè)首要的問題是:實(shí)際運(yùn)用中,非GPU路線的國產(chǎn)AI芯片很難兼容當(dāng)前通用的CUDA架構(gòu)。由于生態(tài)特殊,非GPU路線的國產(chǎn)AI芯片在實(shí)際使用時(shí)還需要做大量高難度的兼容和適配工作,在生態(tài)打造上還有一定差距。

基于此,行業(yè)需要從算法、框架、編譯器、工具鏈、指令集、架構(gòu)、電路等跨層次協(xié)同設(shè)計(jì),才能建設(shè)起自家生態(tài),翻越在存儲、能耗、編譯三座大山,從而更好實(shí)現(xiàn)國產(chǎn)化替代。

(來源芯流科技評論)

標(biāo)簽:ASIC 存算一體 RISC-V 我要反饋 
什么是新一代機(jī)器人界面(HMI)?
ABB協(xié)作機(jī)器人,自動(dòng)化從未如此簡單
優(yōu)傲機(jī)器人下載中心
即刻點(diǎn)擊并下載ABB資料,好禮贏不停~
西克
專題報(bào)道
2023-2024 智能·零碳成果展映
2023-2024 智能·零碳成果展映

“2023-2024智能·零碳成果展映”展示國內(nèi)外企業(yè)推進(jìn)“雙碳”實(shí)踐的最新成果,鼓勵(lì)更多企業(yè)、科研機(jī)構(gòu)、投資機(jī)構(gòu)等廣泛... [更多]

中國國際進(jìn)口博覽會
中國國際進(jìn)口博覽會

11月5日至10日,第七屆中國國際進(jìn)口博覽會在國家會展中心(上海)舉行。152個(gè)國家、地區(qū)和國際組織,近3500家參展企... [更多]

2024 工博會 | 直播探館 · 全景解讀
2024 工博會 | 直播探館 · 全景解讀

第二十四屆中國工博會于9月24日至28日在國家會展中心(上海)舉行,展會以“工業(yè)聚能 新質(zhì)領(lǐng)航”為全新主題。 [更多]