2025年是具身智能從實驗室邁向工廠的關鍵轉折點,其發(fā)展將經歷三個階段:初期,與人類共處同一生產環(huán)境,重點解決人機協(xié)同問題;中期,實現(xiàn)更高效智能的人機協(xié)作,但仍附屬于人類操作;最終,能夠獨立完成任務,人類逐漸淡出生產一線,“無人工廠”成為現(xiàn)實。這一進程預示著工業(yè)數(shù)智化的未來方向,也展示了人工智能在重塑制造業(yè)格局中的巨大潛力。
具身智能就是把AI加載到有行動能力的實體機器人身上,使其長出腦子,從而獲得獨立判斷能力來跟環(huán)境互動,并在環(huán)境中學習進化。開源模型DeepSeek的問世,使算力不再構成限制AI深度進化的瓶頸。具身智能相關技術的數(shù)據(jù)訓練與推理成本顯著降低,效率大幅提升,從而加速了具身智能的創(chuàng)新進程和實際應用部署。
尤其在工業(yè)領域,人形機器人將會跟傳統(tǒng)機械臂一樣常見,成為智能工廠的標配。人形機器人在高溫、高壓、有毒等極端環(huán)境下具有獨特價值,成為人類無法涉足領域的可靠助手。只是在精度、剛性、頻率響應和數(shù)據(jù)融合算法等方面,具身智能還面臨一些挑戰(zhàn)。
人形機器人進入工廠不是要統(tǒng)治制造業(yè),而是為了獲取工業(yè)初始數(shù)據(jù)。機器人+AI最需要的,是采集、標注復雜的3D數(shù)據(jù),互聯(lián)網上很難獲取足夠高質量的3D數(shù)據(jù)。在跟周圍環(huán)境的互動上,AI機器人需要比自動駕駛更精確,比如,工廠里的無人車只需要準確判斷周圍有什么東西,不要走錯了或者撞到了就行,但機器人需要更高的3D感知精度,才能實現(xiàn)高效、精準的手眼協(xié)同,做好設備操作、質量檢測等具體工作。現(xiàn)今很多AI公司面臨的現(xiàn)實困境,主要在應用場景的適配上,尤其是工業(yè)制造領域。具體的工業(yè)應用場景中訓練出來的AI機器人,才能理解工廠里的諸多復雜任務。
AI機器人作為具身智能的重要載體,主要由本體、小腦、大腦組成,小腦(和本體形態(tài)緊密耦合)負責運動控制,大腦負責感知環(huán)境、理解任務和完成復雜任務,需要更加智能。至于機器人要選擇什么形態(tài),輪式雙臂或是雙足人形,也要看具體應用,比如讓機器人擰螺絲,沒必要讓人形機器人去干,傳統(tǒng)機械臂甚至專機+AI就可以了。總體看來,具身智能在工業(yè)領域的應用效果取決于能夠積累多少行業(yè) know how。假以時日,借助更好的AI算法和機械技術,具身智能會將自動化提升至新層次,不僅執(zhí)行任務,更能理解環(huán)境、預測問題并作出決策。
AI大模型降低具身智能技術門檻
為什么具身智能大范圍進入工業(yè)應用場景的趨勢,近幾年才開始出現(xiàn)?這背后有技術突破的推動,有成本降低的助力,也有市場需求的牽引。
技術門檻的降低:AI大模型的崛起與傳統(tǒng)算法的局限
多年以來,世界上技術最頂尖的機器人公司主要是美國的波士頓動力、日本的發(fā)那科(FANUC),以及特斯拉的“擎天柱”(Optimus),很長時間中國公司難以與之匹敵,因為很難跨過一些技術門檻。
在AI大模型出現(xiàn)之前,機器人研發(fā)依賴于傳統(tǒng)算法,需要對機器人運行的環(huán)境進行詳細設定。比如,波士頓動力的機器人在面對平路、爬樓梯等不同環(huán)境時,必須預先設計多種場景參數(shù),才能完成任務。然而,真實世界的環(huán)境復雜多變,哪怕提前設計上萬個環(huán)境參數(shù),也無法覆蓋所有可能的情況。這使得機器人在實際應用中面臨很大的局限性。
然而,AI大模型的出現(xiàn)徹底改變了這一局面。大模型賦予了機器人主動感知和適應環(huán)境的能力,無需再逐一設定環(huán)境參數(shù)。曾經依賴于傳統(tǒng)算法的技術門檻被打破,機器人研發(fā)的復雜性和成本大幅降低。
應用成本的降低:從“奢侈品”到“平民化”
工業(yè)領域有一個經驗賬本,就是當一臺機器人的價格低于一個工人兩年的薪酬時,就有很大的動力讓機器人進入工廠工作。
成本問題一直是制約具身智能大規(guī)模應用的關鍵因素。在傳統(tǒng)算法時代,機器人研發(fā)需要大量資金投入,且生產成本居高不下。波士頓動力的人形機器人定價曾高達200萬美元,哪怕是最擅長降成本的小米公司,2022年發(fā)布的人形機器人概念機定價也高達六七十萬元。但近年,宇樹科技等中國公司已經成功將機器人成本控制在10萬元以內。特斯拉的Optimus人形機器人預計三五年后價格將降至2萬美元,不是最低,但已遠低于傳統(tǒng)機器人的成本。成本的大幅降低使得具身智能產品從“奢侈品”走向“平民化”,使其具備了大規(guī)模進入工業(yè)場景的經濟基礎。
市場需求的牽引:工業(yè)場景的特殊需求與具身智能的優(yōu)勢
具身智能在工業(yè)領域的應用不是要取代傳統(tǒng)設備,而是與之共存并提供獨特價值。憑借在3D感知精度和手眼協(xié)調方面的卓越能力,具身智能產品為工業(yè)制造帶來了顯著優(yōu)勢。比如,特斯拉的Optimus人形機器人已在工廠中展示了初步的應用效果,能夠自主完成電池分揀等任務。盡管其操作速度目前仍不及工人熟練,但其持續(xù)工作能力和不斷優(yōu)化的潛力使其具備了實際應用的價值。
隨著工業(yè)自動化和智能化的推進,企業(yè)對機器人在復雜環(huán)境下的適應能力和靈活性提出了更高要求。工廠中,機器人需要面對復雜的生產線布局和多變的任務要求,具身智能使其能夠自主調整動作,完成任務,而無需依賴工程師的逐條編程和調試。
技術重組驅動具身智能快速迭代
今天,推動具身智能進入工業(yè)應用領域的,很大程度上都是成熟技術的重新組合,而不是特別顛覆性的創(chuàng)新。具身智能(Embodied Intelligence)作為人工智能與物理實體深度融合的產物,其本質是通過機電系統(tǒng)與智能系統(tǒng)的跨界融合,使機器人具備自主感知、規(guī)劃、決策和執(zhí)行能力,從而完成復雜多樣的任務。具身智能進入工業(yè)應用之前,中國就已經在電驅系統(tǒng)、機械臂等硬件領域有了比較完整的供應鏈生態(tài),智能系統(tǒng)的發(fā)展迭代也保持一定的領先。
過去,波士頓動力或者發(fā)那科設計的機器人,都是采用液壓傳動,而現(xiàn)在新一代的機器人公司普遍采用電驅模式。在中國,電動車已經是大規(guī)模商業(yè)化的成熟產品,將成熟的電驅系統(tǒng)嫁接到機器人身上,技術可靠,而且成本合適。電驅模式的最大好處在于其快速響應能力,芯片下達指令后能迅速執(zhí)行,這在需要即時反應的場合尤為重要,比如人形機器人在面對突發(fā)的環(huán)境變化時,無法承受液壓系統(tǒng)幾秒延遲的后果。因此,電機與AI結合的方案在這方面具有顯著優(yōu)勢,正如電動車在智能駕駛方面相較于傳統(tǒng)燃油車更具優(yōu)勢,關鍵區(qū)別就在于電驅系統(tǒng)的快速響應和精確控制。而唯一的缺點,就是電驅系統(tǒng)的力量輸出相對有限,但在諸如工廠中的操作設備、質量檢測等任務中,并不需要特別大的力量;對于需要較大動力的搬運、裝配工作,則可繼續(xù)采用傳統(tǒng)的機械臂解決方案。
正如布萊恩·阿瑟在《技術的本質》中指出的,技術進步是一個遞歸的過程,所有新技術均源于已有技術的重組。因此,推動技術發(fā)展的最佳途徑是促進不同技術間的碰撞與組合。對于AI機器人而言,未來或許僅有10%的進步源于原始學術創(chuàng)新,而90%將依賴于工程實現(xiàn)的進步。特別是在工業(yè)應用領域,技術迭代顯得尤為關鍵。
國內電子制造企業(yè)在引入智能裝配機器人后,迅速經歷了顯著的技術迭代。初期,這些機器人僅能執(zhí)行如螺絲擰緊等簡單重復任務,需要頻繁的人工干預。但隨著算法優(yōu)化與傳感器技術的進步,它們現(xiàn)在能夠獨立完成復雜的電路板組裝。通過深度學習,機器人除了能精準識別并放置微小元件,還能根據(jù)實時反饋自我校正,從而大幅提升生產效率和質量穩(wěn)定性。此外,新一代機器人配備了更先進的視覺系統(tǒng),能夠在無序環(huán)境中自主導航并選取部件,降低了物料擺放要求,減少了人力成本,也增強了生產的靈活性和響應速度。持續(xù)的技術進步使AI機器人從生產線上的輔助角色轉變?yōu)椴豢苫蛉钡暮诵牧α俊?/p>
具身智能在工業(yè)應用領域的進化方向
在工業(yè)應用領域,具身智能的進化遵循“感知-思考-實現(xiàn)”框架,分別對應信息獲取、決策制定與行動執(zhí)行三個關鍵環(huán)節(jié)。三個環(huán)節(jié)上的每一次科技突破,都預示著產業(yè)變革的潛在爆發(fā)點。谷歌搜索通過革新信息獲取方式重塑了“感知”;OpenAI的GPT模型,憑借其強大的知識學習能力重新定義了“思考”;而人形機器人與智能體的深度融合,正推動智能操作進入全新階段。比如,AI機器人利用觸覺反饋實現(xiàn)類似人類的手指靈活性,為未來工廠帶來了前所未有的精細作業(yè)能力。同時,智能聽覺技術的進步讓生產環(huán)境中的聲音分析達到新高度,確保設備運行的安全與穩(wěn)定。未來,一個集視覺、語言和動作(VLA)于一體的綜合智能模型將成為智能制造領域的核心技術趨勢,推動智能工業(yè)實現(xiàn)更高水平的智能化和柔性化。
從技術發(fā)展的趨勢來看,具身智能在工業(yè)領域的進化方向并不是追求大而全的通用模型,而是聚焦于細分領域的專用小模型。這種趨勢符合工業(yè)場景的實際需求,更在成本、效率和專業(yè)性上顯示獨特優(yōu)勢。
小模型的“小”并非指其智能不足,而是指其專注于特定的工業(yè)任務和場景。例如,在質量檢測領域,小模型可以通過對特定瑕疵的識別和分析,替代傳統(tǒng)人工檢測方式,顯著提高檢測效率和準確性。這種專注性使得小模型在訓練數(shù)據(jù)的需求上大幅降低,無需像大模型那樣依賴海量的通用數(shù)據(jù)。以工業(yè)檢測為例,小模型僅需針對特定產品或工藝的數(shù)據(jù)進行訓練,即可實現(xiàn)高效的檢測能力。
此外,小模型的參數(shù)規(guī)模較小,通常在幾億到幾十億之間,相比大模型上千億的參數(shù),其計算資源消耗和訓練成本大幅降低。在實際應用中,小模型的高效能和低成本使其能夠在資源受限的工業(yè)環(huán)境中快速部署,比如在邊緣計算設備或工業(yè)機器人上實現(xiàn)端側智能。這種輕量化的特點提高了模型的響應速度,還降低了企業(yè)的技術門檻和運營成本。
工業(yè)領域的具體應用中,小模型展示了卓越的專業(yè)性,比如AI驅動的“晶圓缺陷檢測系統(tǒng)”。這一芯片制造上游環(huán)節(jié)對細節(jié)要求極高,傳統(tǒng)上依賴經驗豐富的技師目視檢查。然而,通過訓練AI識別歷史缺陷圖像,實現(xiàn)了比人工檢查更高的準確性和更低的成本。即使在這樣一個細分領域,技術革新一旦產生積極效果,便能開辟新的發(fā)展路徑。
AI是否會取代人類工程師
過去講“機器換人”,主要是用機械臂替代技術工人,現(xiàn)在講“具身智能”,更多是讓AI替代工程師。2025年被認為是AI Agent(智能體)的爆發(fā)年,人形機器人+智能體將成為智能工廠深度進化的一大動力引擎。
有人預測,未來會有10億~30億臺人形機器人的需求。如今全球汽車總數(shù)大約15億輛,未來,人形機器人的數(shù)量和如今的汽車是類似的。人形機器人作為實現(xiàn)具身智能的關鍵平臺,近年來在技術和設計上取得了顯著進步。以特斯拉Optimus機器人為例,通過復雜的關節(jié)系統(tǒng)(包括旋轉和線性關節(jié)),實現(xiàn)了高度靈活的動作表現(xiàn)。這一成就的背后,是電機、減速器、傳感器等組件的高度集成化設計。
與此同時,人形機器人的“大腦”——即具身智能大模型,也在持續(xù)進化中。例如,Grok3大模型近期引入了“思維鏈”推理機制,使機器人能夠模仿人類逐步解決復雜問題的方式進行思考。這一技術進步擴展了人形機器人在工業(yè)、服務等多個領域中的應用潛力,還為更廣泛的任務執(zhí)行提供了新的可能性。
最重要是特斯拉工廠內的真實工作環(huán)境,為純電動汽車生產而設,同時也成為自家AI機器人的天然訓練場地。這里的工作環(huán)境與任務皆為實際情形,使用的是特斯拉自主研發(fā)的機器人,這為后續(xù)類似工作的開展提供了極大便利,特別是在數(shù)據(jù)收集和實驗調整方面表現(xiàn)尤為突出。相比之下,其他任何人形機器人公司都無法享有這樣的條件來提升機器人在真實工業(yè)應用場景中的工作可靠性。
另一方面,智能體被認為是AI發(fā)展的高級階段,就是要讓AI直接幫你干活。具體來說,就是將大型語言模型轉化為具備知識獲取、工具使用以及推理能力的數(shù)字助手。這些智能體能夠在各種環(huán)境中擔任數(shù)字員工、顧問或專家的角色,替代人類完成一系列復雜任務。它們能夠利用多模態(tài)技術感知周圍環(huán)境,也能通過與具身智能的結合,實現(xiàn)在物理世界中的任務執(zhí)行,尤其在處理重復性高、規(guī)則明確的工作時表現(xiàn)出色,如結構強度校核、公差分析等領域。如此一來,AI就如同擁有了手腳,變成擁有不同專長的助理,可以依據(jù)用戶的不同需求提供精準服務。
AI在工程領域的應用與局限
AI在工程領域的應用已經初見成效,比如,AI可以通過參數(shù)優(yōu)化、輔助建模等方式完成部分重復性工作,效率遠超人類。在機械設計中,AI能夠生成標準零件庫、模擬測試,甚至在某些場景中提供初步設計方案。然而,AI的局限性同樣明顯,無法像人類工程師那樣理解復雜需求、權衡倫理風險,或在突發(fā)問題中靈活決策。比如,AI可以快速生成設計方案,但無法判斷該方案是否符合企業(yè)成本限制、用戶情感需求或環(huán)保法規(guī)。
人類工程師的獨特價值
盡管AI在工業(yè)應用領域表現(xiàn)出色,但人類工程師的獨特價值不容忽視。工程師具備專業(yè)知識,能夠理解復雜需求、進行倫理判斷,并在復雜環(huán)境中靈活決策。例如,波士頓動力的Spot機器人在運動控制方面表現(xiàn)出色,但其背后仍需要人類工程師的精心設計和優(yōu)化。此外,人類工程師在創(chuàng)造力、判斷力上具有不可替代的優(yōu)勢,能夠設計出更具創(chuàng)新性和適應性的解決方案。
人形機器人與智能體正朝著深度融合的方向發(fā)展,在展示機械結構、傳感器技術等硬件層面顯著進步的同時,也推動了機器學習、深度學習及自然語言處理等軟件算法的突破。這些進展使得AI在效率、精度方面擁有了顯著優(yōu)勢,但其持續(xù)的發(fā)展和應用仍然離不開人類工程師的創(chuàng)造力與專業(yè)判斷。未來,人形機器人+智能體的發(fā)展將更多體現(xiàn)在與人類工程師的合作上,而非取代人類。AI將成為工程師的“超級助手”,幫助其完成重復性任務,提供數(shù)據(jù)支持和初步方案。尤其是在工業(yè)場景中,人形機器人可以承擔危險或單調的工作,而人類工程師則專注于復雜的設計和優(yōu)化。
具身智能工業(yè)應用的三階段展望
具身智能要大范圍進入工業(yè)應用場景,還需要適配時間。時至今日,國內市場上的機械臂已經不算貴了,但很多企業(yè)不愿意用。購置一個機械臂只需要幾萬元,但還需配備一個高工資的工程師進行調試,適應頻繁的訂單與產線變化,相比之下,讓有經驗的老師傅帶幾個臨時工,很快就能干活了。
具身智能將重塑行業(yè)對自動化的認知,但用好AI必須是一個劃算的事。傳統(tǒng)流水線通過標準化流程消除個體差異,逐步用機械設備替代人力。然而,當機器人具備人類的感知、理解和靈活應對能力時,工作流程將迎來根本性變革。
具體而言,在生產線各環(huán)節(jié)中,“具身智能工人”與“具身智能設備”能夠執(zhí)行復雜任務,還能通過迭代學習優(yōu)化自身行為,實現(xiàn)高度的生產靈活性和即時響應,從而提升效率、降低成本,并增強產品質量和市場適應性。
工業(yè)數(shù)智化的進程中,具身智能機器人作為革新主力,通過集成AI、傳感器及云計算的新一代控制平臺,顯著提升了運行效率與能耗表現(xiàn)。這些機器人利用多傳感器融合實現(xiàn)一體化作業(yè),能在復雜環(huán)境中執(zhí)行多樣化任務?;诹Ⅲw視覺識別技術的智能焊接機器人能夠自主識別工件、規(guī)劃作業(yè)軌跡,展現(xiàn)出類似人類的操作靈活性。此外,多模態(tài)機器人大模型通過3D視覺與AI深度融合,進一步增強了感知與決策能力,大幅降低了操作門檻并提高了生產效率。
復雜工業(yè)場景面臨實時交互強、數(shù)據(jù)源多樣、工藝流程復雜及物理規(guī)則嚴格等挑戰(zhàn)。為此,需構建完善的具身智能知識庫,通過理論框架設計、關系映射模型及物理交互表征機制的多維度研究,實現(xiàn)知識庫的自主演進與智能決策,以適應動態(tài)生產需求。
在通用終端形態(tài)探索中,人形機器人并非唯一解。具身智能可通過“一腦多機”模式賦能多樣化設備(如工業(yè)機床),例如,單一AI核心可同步調度無人機群與地面機器人,實現(xiàn)高效任務協(xié)同。
機器除了能處理數(shù)據(jù),還能像人類一樣理解和響應物理世界。2025年是具身智能從實驗室邁向工廠的關鍵轉折點。具身智能工業(yè)機器人(EIIR)通過高度自動化和智能化,顯著提升了生產效率與質量。EIIR的發(fā)展將經歷三個階段:初期,EIIR與人類共處同一生產環(huán)境,重點解決人機協(xié)同問題;中期,在技術進步推動下,EIIR實現(xiàn)更高效智能的人機協(xié)作,但仍附屬于人類操作;最終,隨著智能化水平的提升,EIIR能夠獨立完成任務,人類逐漸淡出生產一線,“無人工廠”成為現(xiàn)實。這一進程預示著工業(yè)數(shù)智化的未來方向,也展示了人工智能在重塑制造業(yè)格局中的巨大潛力。
(來源:中國工業(yè)和信息化)