智能汽車時代的加速到來,使車載智能系統(tǒng)面臨前所未有的算力需求。隨著越來越多車型引入電子電氣架構轉向中心化、智能駕駛的多傳感器融合、智能座艙的多模態(tài)交互以及生成式AI驅動的虛擬助手等創(chuàng)新技術,都要求車用主芯片能夠同時勝任圖形渲染、AI推理和安全計算等多重任務。當下,功能安全、高效高靈活性的算力、產品生命周期,以及軟件生態(tài)兼容性這“四大核心要素”,已成為衡量智能汽車AI芯片創(chuàng)新力和市場競爭力的核心標準。
傳統(tǒng)汽車計算架構中,往往采用CPU與GPU或/和NPU等計算單元組成異構計算模式;隨著自動駕駛算法從L1向L5快速演進對軟件適配性的要求越來越高,以及不斷有新的傳感器和信息娛樂設備加入車內,不同的架構開始出現不同的發(fā)展軌跡。同時,系統(tǒng)復雜性快速提升、大量的數據搬運、資源調度協同難度提升和軟件快速迭代等新挑戰(zhàn)開始出現,使缺乏靈活性的硬件架構成為了在技術、安全和成本等多個方面制約汽車智能化發(fā)展的瓶頸。
市場急需一種既能靈活地提供高性能、高效圖形與AI加速能力,同時滿足功能安全標準、可與廣泛的軟件生態(tài)對接且總成本更低的車用芯片架構。
功能安全不僅關乎安全也是芯片成本控制關鍵
功能安全永遠是消費者、主機廠、Tier-1和芯片供應商首先關心的問題,但它并不是一個智能駕駛技術快速發(fā)展進程中才出現的問題;行業(yè)已經形成了完善的ISO26262標準和ASIL認證體系,以及鎖步(Lock-Step)和雙套硬件結果對比等解決方案。但是隨著車用芯片中的CPU、GPU和NPU越來越復雜并占用更大面積,這些原本為MCU提供的功能安全解決方案的硅成本和復雜性都大幅提升,因此市場需要在汽車芯片功能安全解決方案領域實現創(chuàng)新。
作為汽車電子領域的一項創(chuàng)新產品,Imagination DXS GPU IP專注于智能座艙與自動駕駛場景的深度優(yōu)化,其設計充分體現了業(yè)界近期在功能安全方面的巨大突破,同時確保了性能的提升、安全性的增強以及芯片成本的有效控制。Imagination DXS GPU的峰值性能較前一代產品提升了50%,算力從單核的0.25TFLOPS擴展至1.5TFLOPS,最高可達6TFLOPS和24TOPS,同時支持高達192GPixel/s的圖形渲染速率。
在功能安全的實現上,Imagination DXS GPU采用了針對GPU運算開放的分布式安全機制(DSM),僅以10%的面積開銷就實現了ISO 26262 ASIL-B功能安全認證。DSM利用了處理器的并行特性,在空閑周期運行安全測試,既保證了性能不受影響,又確保了安全,打破了鎖步和備份等傳統(tǒng)安全設計的局限性。這一創(chuàng)新設計從架構層面闡釋了功能安全領域仍然存在著許多創(chuàng)新機會,可以幫助越來越先進的GPU在安全保障、系統(tǒng)復雜性、成本控制與下游廠商獲得認證等多個方面創(chuàng)造價值。
正是因為Imagination DXS GPU在功能安全性和計算性能等方面實現了開創(chuàng)性的突破,在2025年5月于上海舉辦的 “第十二屆汽車電子創(chuàng)新大會暨汽車芯片產業(yè)生態(tài)發(fā)展論壇(AEIF 2025)”上,Imagination DXS GPU IP憑借其創(chuàng)新的、先進的GPU技術,榮獲“2025 汽車電子?金芯獎-新銳產品”殊榮。據了解,從該公司的D系列GPU IP產品開始,包括最新的公布了架構的E系列中的車用GPU IP都將采用這種成本和復雜性都具有明顯優(yōu)勢的分布式功能安全機制。目前,DXS GPU IP已集成于瑞薩R-Car Gen 5系列SoC中,助力智能駕駛技術的商業(yè)應用,滿足從入門級到旗艦車型的全方位需求。
高靈活性的高效算力是車用處理器的核心功能
對于車用芯片設計企業(yè),為了處理越來越復雜的AI計算和圖形渲染,在其計算芯片中采用GPU或者NPU這樣的并行處理器成為了必然;然而隨著汽車電子電氣架構從域控制轉向中央控制,車用核心處理器不僅需要更高的算力,而且還需要針對不同的應用可以在架構上靈活地進行優(yōu)化,也就是需要性能更高、同時又不會被鎖死在NPU或者GPU架構上的靈活架構,這也成了汽車和其他很多邊緣AI應用中高性能并行計算的發(fā)展方向。
對于這種可以針對應用進行優(yōu)化和定義的并行計算處理器架構,依然是Imagination憑借其技術前瞻性和能力,而重新定義了面向汽車和端側AI的高性能并行計算行業(yè)標準。2025年5月,Imagination推出了專為端側智能場景設計的新一代E系列(E-Series) GPU IP架構,該系列GPU憑借其高效的并行處理架構,在提供卓越圖形性能的同時,針對人工智能工作負載具備靈活算力擴展能力。
E系列GPU架構集成了神經核(Neural Cores)和爆發(fā)式處理器(Burst Processors),支持算力從2TOPS靈活擴展至200TOPS(INT8/FP8),滿足從基礎端側計算到高階智駕的多樣化算力需求。這樣的架構設計使Imagination E系列GPU同時具有了NPU的高性能和GPU的高靈活性;通過優(yōu)化指令調度和數據復用機制,端側計算的平均功耗效率提升了 35%,在相同算力條件下,車載系統(tǒng)的功耗降低了20%。
這種高效且靈活的AI算力及圖形處理功能調配,完美貼合了在包括汽車在內的端側AI場景中同時存在大量的AI計算與圖形處理需求的應用,優(yōu)化了中央計算模式下核心車用芯片同時處理駕駛和座艙需求的性能與能耗。此外,通過升級硬件級虛擬化技術,E系列GPU IP支持多達16個虛擬機任務隔離,實現了AI、圖形、UI等多任務的異步并行處理,確保了智能座艙多系統(tǒng)協同工作和自動駕駛多任務并行處理的車用場景需求。以“高靈活性的高效算力”為核心,E-Series GPU不僅滿足了未來智能汽車車用處理器的算力需求,并推動了汽車智能化體驗的進一步提升。
更長的產品生命周期:GPU 架構的可編程性打破總成本困局
隨著智能駕駛和智能座艙技術從旗艦車型向中低端車型的滲透,主機廠對芯片成本的嚴格控制正在推動行業(yè)打破傳統(tǒng)開發(fā)模式的局限性。根據行業(yè)數據,傳統(tǒng)車用計算芯片的開發(fā)成本高達2億-3億美元,研發(fā)周期長達3~5年。在算法需要迭代時,固定功能架構的NPU芯片必須重新流片,每次迭代的成本占到初始開發(fā)費用的40%~50%。這種“高投入、長周期、低彈性”的開發(fā)模式,在主機廠追求“一款芯片滿足多車型10年生命周期”的目標面前,明顯暴露出成本上的限制。
因此,相對于從架構到功能都基本固定的基于NPU車用控制芯片,采用GPU IP的車用芯片可以更加從容地去面對這樣的總成本壓力,因為采用GPU的硬件設計可以通過更高的可編程性來實現跨算法、跨廠商和跨車型應用,用更大數量的市場應用來攤低高昂的芯片研發(fā)成本,因而基于GPU架構的車用芯片比基于NPU的車用芯片擁有更長的產品生命周期和更高的應用靈活性。
當然,如果車用芯片中GPU本身的AI計算與圖形處理能力就可以靈活配置,那么還會帶來更高的成本節(jié)省和更長的產品生命周期。以Imagination在其GPU IP產品中推動的可編程泛化架構以及由此開發(fā)的E系列GPU為例,其通過軟件定義硬件的設計,可將芯片硬件生命周期延長至10年以上:當AI模型升級時,僅需數月軟件適配即可完成迭代,較傳統(tǒng)NPU迭代方案大幅減少。這種統(tǒng)一計算單元設計可跨汽車、工業(yè)等幾大場景復用,硬件設計成本降低40%,研發(fā)投入回收周期顯著縮短。
開放軟件生態(tài):一次開發(fā)、多場景部署
軟件生態(tài)和可適配性正在變成各種高性能計算的重要門檻,英偉達的CUDA生態(tài)使其在AI計算和汽車芯片方面占盡了先機。因此,其他的汽車和端側AI芯片廠商要在市場中斬獲更多份額,就需要其核心計算單元IP提供商構建更加開放的軟件生態(tài);隨著諸多基于此目的的標準組織不斷建立和壯大,其中的主要玩家正在支持新一代車用芯片開發(fā)商解決軟件生態(tài)的問題。
例如,Imagination就構建了一個面向未來的開放體系,其核心優(yōu)勢在于“一次開發(fā),多場景部署”。其算力可以通過OpenCL、Vulkan等主流API直接調用,開發(fā)者利用oneAPI、Apache TVM等工具鏈,可以輕松地將工作負載遷移到E系列GPU中的神經核。這種可編程性不僅大幅降低了跨平臺開發(fā)的成本,還賦予了設備適應未來算法變革的靈活性。面對生成式AI、多模態(tài)交互等前沿應用的快速迭代,E系列GPU無需硬件迭代,僅通過軟件升級就能迅速適應,確保產品持續(xù)滿足新興需求。
在自動駕駛領域,Imagination的GPU IP同樣遵循“一次開發(fā),多場景部署”的理念。通過集成FP16流水線以及imgBLAS、imgNN等高效計算庫,顯著提升了雷達點云數據、視覺SLAM等傳感器數據的處理速度,有效減輕了CPU和NPU的負擔。同時,通過與OpenCL、Vulkan等開放標準以及CoreAVI安全驅動的兼容,確保了在復雜場景下系統(tǒng)的實時響應和穩(wěn)定運行,使技術能力貫穿智能座艙、自動駕駛等多個場景,鞏固了跨場景部署的技術基礎。
結語
從Imagination的E系列GPU等產品實現的架構創(chuàng)新來看,用于智能汽車等端側應用的AI芯片也在重塑其技術邏輯,更揭開了端側AI計算革命的序幕。在智能汽車領域,功能安全、高效靈活的算力、生命周期管理與開放軟件生態(tài)這四大要素構建的技術護城河,正推動行業(yè)從“硬件堆砌”向“智能進化”轉型;而在更廣闊的端側 AI場景中,這種“軟件定義硬件”的理念正在幫助消費電子、工業(yè)物聯網、智慧城市和智能商業(yè)等邊緣計算等領域全面擁抱AI技術。
這種變革的深層意義,在于打破了“云-邊-端”的技術壁壘。當智能汽車的GPU架構能夠通過軟件升級支持智慧城市的交通調度算法,當工業(yè)設備的計算單元可復用至消費電子的AI交互場景,端側AI正從單一功能模塊進化為“可生長的智能體”。可進化的端側芯片將如同今日的CPU般,成為所有智能設備的“數字大腦”。
作者:北京華興萬邦管理咨詢有限公司 翔煜 商瑞
(來源:華興萬邦)