文 | DoNews 雁秋
編輯 | 李信馬
說起2025年的科技與產業(yè)領域,具身智能是繞不開的關鍵詞。它是怎么被公眾記住的呢?蛇年春晚舞臺應該是一切的起點,16臺人形機器人首次完成真正意義上的“破圈”,拉開一場具身智能風暴。
在專業(yè)視角下,具身智能被理解為一種擁有物理身體、能通過感知環(huán)境并自主決策、進而與動態(tài)世界交互的智能實體。它不僅代表人工智能從虛擬向實體的“范式躍遷”,也被視為人工智能與機器人學的深度融合。

圖源:蛇年春晚 宇樹機器人
2025年,具身智能被寫入《政府工作報告》,二十屆四中全會審議通過的“十五五”規(guī)劃建議將其列為前瞻布局的未來產業(yè)之一,標志著國家對這一前沿技術戰(zhàn)略價值的正式認可。
2025年,具身智能成為廠商押注、資本涌入的核心戰(zhàn)場,相關板塊熱潮涌動,相關概念持續(xù)升溫。據開源證券統(tǒng)計,中國具身智能領域融資總金額已超過500億元,融資事件超過200起,較2024年全年增長超400%。
2025年,一大批具身智能產品從虛擬的數字世界走進真實的物理空間:有的可以走進工廠組裝、搬運,有的化身廚師烹飪、制作咖啡,有的能夠講解接待、提供文娛商演,有的甚至可以給老人洗發(fā)、做艾灸......
我們站在這場風暴的起點,看到企業(yè)一步步從展示炫酷Demo到驗證技術、打磨產品、尋找場景。資本涌入、場景落地交織在一起,共同推動這個“AI長出四肢”的交叉物種走出實驗室。
但隱憂并未消散,產業(yè)仍面臨模型、本體與數據的挑戰(zhàn),具身智能遠未達到泛化能力。技術鏈條的成熟性、市場預期是否過熱以及人機共存的未來將會如何,還有很多可以討論的空間。
01、關鍵詞:技術——從理解世界到自主行動
具身智能在2025年的最顯著變化,是技術架構的轉變。
根據世界機器人大會發(fā)布的《2025具身智能機器人十大發(fā)展趨勢》,具身智能正從「物理實踐、物理模擬器與世界模型協(xié)同驅動的具身感認知」到「多層次端到端的具身決策」全方位演進。
想要理解這句話是什么意思,我們需要簡單拆分下,了解物理實踐、物理模擬器、世界模型,以及多層次端到端的概念。
想象一下,你要求家庭機器人“把餐桌收拾干凈”。對人類來說,這是簡單的指令,但機器人需要識別各種物品、理解“收拾”的含義、規(guī)劃動作順序,并應對突發(fā)情況——比如移動的寵物或滑落的餐具。
實現這一目標的核心,不僅要依托大模型的算法,還要將機器的身體結構以及與環(huán)境的互動緊密關聯(lián)起來。這就要求機器人要建立對物理世界的認知基礎,就像人類嬰兒通過觸摸、觀察和互動來學習世界運行規(guī)律的過程。
物理實踐,是機器人學習的根本途徑,是讓機器人在與真實環(huán)境的互動中積累經驗,理解物體屬性、力學規(guī)律和動作后果。
物理模擬器,可以看做一個高效“訓練場”,機器人可以在高保真的虛擬環(huán)境中進行數百萬次試錯學習,加速技能掌握。
世界模型,則是機器人的“想象力引擎”。它通過從海量數據中提煉環(huán)境運行規(guī)律,使機器人能在行動前進行“思維”,預測不同行動可能產生的結果。
當機器人具備了基本的世界理解能力后,挑戰(zhàn)就轉向如何將這些理解轉化為實際行動——這正是“多層次端到端的具身決策”要解決的問題。
多模態(tài)大模型在這一轉變中扮演了關鍵角色,它能夠整合視覺、語言、觸覺等多種信息,理解復雜指令的深層含義,并生成相應的行動計劃。就像是給具身智能嵌入了“大腦”,讓其推理、交互等方面的智能水平明顯提升。
在這一技術范式下,兩種主流架構并行發(fā)展:端到端的具身模型(例如VLA)和分層決策模型,它們代表了兩種截然不同的技術哲學。
- 端到端具身模型:可實現直接端到端的從人類指令到機器執(zhí)行,即輸入是圖像及文本指令,輸出的是動作。
- 分層決策模型:大模型擔任指揮官,傳統(tǒng)控制技術充當執(zhí)行者。這是目前主流的工程化思路,其核心在于將“思考”與“執(zhí)行”解耦,形成清晰的決策鏈條。
未來的趨勢并非簡單的二選一,而是走向分層與端到端的有機融合。一方面,高層任務規(guī)劃和語義理解將保持模塊化以確??山忉屝裕涣硪环矫?,底層技能的執(zhí)行將通過端到端學習或“世界模型”的訓練,變得越來越通用、靈活和自適應。
需要注意的是,在2025年,數據基礎依舊是具身智能發(fā)展的關鍵瓶頸與突破點。具身智能需要上億條訓練數據才能達到完全自主水平,但現有公開數據集最大僅在百萬量級。
為解決這一難題,產業(yè)界正從兩個方向努力:基于物理實體采集與仿真合成構建大規(guī)模高質量具身智能數據集。與此同時,科研界期望在保證質量的前提下,讓數據規(guī)模“變小”,通過更高效的數據利用提升訓練效率。
可以預測,2026年能搶到數據話語權的企業(yè),日子不會過得太差。
02、關鍵詞:產業(yè)——頭部差異化路徑與競爭格局
2025年,國家政策對具身智能產業(yè)的支持力度達到新高,具身智能首次被寫入政府工作報告,成為國家未來產業(yè)重點培育方向。與此同時,北京、上海、深圳等地同步發(fā)力,通過設立千億級產業(yè)基金、開展核心技術攻關專項、完善基礎設施配套等舉措,形成了“國家-地方”協(xié)同推進的產業(yè)發(fā)展格局。
摩根士丹利統(tǒng)計顯示,2025年下半年,中國具身智能廠商披露的訂單總額已超20億元。具身智能行業(yè)正站在產業(yè)化的門檻上。
伴隨著“訂單潮”,行業(yè)競爭從產品層面升級至生態(tài)層級,不同類型的具身智能企業(yè)選擇了差異化的發(fā)展路徑,形成了多元化的產業(yè)生態(tài)——工業(yè)派、技術派以及場景派。
- 工業(yè)派
深耕制造,追求群體智能與高效生產,以優(yōu)必選、智平方為代表。
優(yōu)必選提出的「群腦網絡軟件架構」,推動工業(yè)人形機器人從單機自主向群體智能進化。目前已與東風柳汽、吉利汽車、比亞迪等多家車企達成合作。
智平方走通了“模型+場景”的閉環(huán)路徑,在汽車制造、生物科技、半導體制造等多個高價值場景實現商業(yè)落地。公司與華熙生物合作,部署機器人在無菌車間執(zhí)行物料轉運、智能拆包等任務;2025年4月發(fā)布全域全身VLA大模型,并與東風柳汽合作,將機器人應用于汽車制造全場景。

圖源:優(yōu)必選官網
- 技術派
專注于核心模型與算法突破,探索通用智能邊界,以宇樹科技、智元為代表。
智元在2025年推出了全球首個“個人機器人”啟元Q1,主要面向極客玩家、家庭以及科研教育等用戶。這款小尺寸全身力控人形機器人可以折疊后裝進雙肩包,極大地降低了科研試錯成本。
宇樹科技則持續(xù)優(yōu)化機器人運動控制能力。在第七屆北京智源大會上,宇樹G1展示了敏捷的格斗動作,以及出色的語音對話、環(huán)境感知和行動決策能力。CEO王興興明確表示,這些表演性展示并非終極目標,解放人類生產力才是機器人的使命。
- 場景派
深入垂直行業(yè),解決具體痛點,以云深處科技為代表。
云深處啟動A股上市輔導,主要產品包括四足機器人、人形機器人及核心零部件,四足機器人已實現上下樓梯、自主導航等功能,應用于電力巡檢、應急救援等領域。目前,其絕影X30四足機器人已在電力巡檢場景中實現1000+小時平均無故障工作,并能夠自主判斷電量前往充電樁充電。
更令人印象深刻的是,云深處的機器人深入可可西里無人區(qū),偽裝成“機器藏羚羊”近距離觀察野生動物,展現了在極端環(huán)境下的卓越適應能力。
2025年10月,《具身智能產業(yè)圖譜》正式發(fā)布,清晰呈現了產業(yè)生態(tài)布局、上下游協(xié)同關系及重點企業(yè)分布,為從業(yè)者提供了全景式產業(yè)“導航儀”。在應用場景拓展方面,2025年科技創(chuàng)變者大會發(fā)布了“具身智能行業(yè)十大應用場景”,覆蓋物流、零售、制造、海洋、能源等關鍵領域。
產業(yè)落地的速度令人矚目。智元機器人預計2025年真實出貨量超5000臺,銷售額超10億元。優(yōu)必選Walker系列人形機器人2025年全年訂單總金額已達到13億元(不含全尺寸科研教育人形機器人“天工行者”及小型人形機器人“AI悟空”)。其工業(yè)人形機器人產能已達到每月300臺,預期全年交付量將超過500臺。
但現實情況是,核心挑戰(zhàn)依然存在。摩根士丹利的報告指出,許多廠商高調宣布的“大額訂單”中,相當一部分屬于框架協(xié)議或意向訂單,而非確定性的采購合同,且產能不足成為行業(yè)普遍痛點。
政策層面也提出了要求,國家發(fā)改委在2025年11月27日的新聞發(fā)布會上明確指出,隨著新興資本加速入場,需要“著力防范重復度高的產品‘扎堆’上市、研發(fā)空間被壓縮等風險”。這意味著,缺乏核心技術、僅靠組裝和模仿的企業(yè)生存空間將急劇縮小。
03、關鍵詞:市場——從“表演經濟”到“價值創(chuàng)造”
若用一個詞來形容2025年具身智能在資本市場的發(fā)展狀態(tài),“狂熱”或許最為貼切。
據不完全統(tǒng)計,2025年前三季度,國內機器人行業(yè)新增一級市場融資事件達610筆,融資總額約500億元,是去年同期的2.5倍。創(chuàng)投數據平臺IT桔子顯示,截至12月18日,2025年至少有165家具身智能企業(yè)完成303次融資,累計融資金額近370億元,較2024年全年增長近260%。
資本火熱下注的同時,具身智能在2025年也完成了表演型到實用型的轉變。
上半年,從蛇年春晚舞臺上人形機器人的表演,到深圳地鐵智能安檢機器人上崗,再到全球首個人形機器人馬拉松在北京開跑,這些高調亮相不僅吸引了公眾目光,也為行業(yè)帶來了前所未有的關注度。
這一時期,具身智能的價值主要體現在吸引投資、提升品牌和公眾教育上。諸如舞蹈、握手、倒立、拳擊等互動,程序高度預設,環(huán)境被嚴格控制。機器人被要求“完成即勝利”,不計成本和穩(wěn)定性。
這種以“炫技”為導向的發(fā)展模式很快顯露出其局限性,有人直言,這種表演更像是打著改變人類生活口號而建的秀場。
轉變發(fā)生在多模態(tài)大模型的落地,這一技術使得機器人可以不再依賴預設程序執(zhí)行任務,而是具備了在開放環(huán)境中理解意圖、規(guī)劃動作、應對擾動的能力。
這一時期,具身智能的核心是融入生產流與服務鏈,解決具體問題并證明經濟性,價值直接體現在降本、增效、提升安全與質量。比如在工廠,工人只需對機器人說“把那個有毛刺的零件挑出來返工”,機器人便可通過視覺識別、路徑規(guī)劃自主完成全套動作。
在2025世界機器人大會上,我們看到了可視化的進展。200余家國內外企業(yè)集中展示了落地成果,機器人不再是整齊劃一的靜態(tài)陳列,而是進入高重復、高危、高成本的場景,從單純的生產工具,轉變?yōu)榧鎮(zhèn)鋽祿杉?、經驗沉淀乃至智能貢獻的“全能選手”。

圖源:DoNews攝
比如開普勒的人形機器人K2“大黃蜂”完成了8小時連續(xù)直播工作,模擬了物流分揀、搬運等場景,其研發(fā)團隊將8小時續(xù)航設定為「從實驗室樣機走向商用產品」的關鍵一步,旨在適配朝九晚五的班次需求。
在工程場景之外,機器人還進入到其他有趣且與普通人密切相關的場景。
跨維智能的人形機器人 DexForce W1 Pro 在沖咖啡時展現出穩(wěn)定的長線程工作能力。在機器人準備放置膠囊時,卻被工作人員突然拿走,但它并未宕機或陷入混亂,而是短暫地停頓,雙眼攝像頭重新掃描桌面,幾秒后,定位目標,再次精準取回膠囊,繼續(xù)后續(xù)的任務。
京東通過JoyInside平臺,將機器人部署在零售、家居等真實場景中交互和銷售,2025年“618”期間其智能機器人銷售額大幅增長;美團與合作伙伴打造全球首個人形機器人智慧藥房,實現24小時無人化藥品揀選和交付,旨在降低服務履約成本。
這些都證明了機器人已經可以在生活中給人們提供便利。
與此同時,更多場景的應用推動機器人公司的業(yè)績增長。宇樹科技王興興公開表示,公司2024年度營收規(guī)模已達到約10億元。該公司近日已完成IPO輔導,智元機器人已完成股改,還有樂聚機器人正在IPO輔導中。
04、關鍵詞:認知——從“替代恐懼”到“價值審視”
假設機器人全面進入人類的生活,那會是什么樣子?
電視劇《世界奇妙物語》描繪過這樣的畫面:在劇中,代替人類的機器人每天重復著相似的言行,去完成常規(guī)的工作任務,而人類只需穿戴智能設備,長年在睡眠艙中過上夢寐以求的日子……
然而在現實生活中,人們對機器人的到來首先感到的是「恐懼」。2025年初,社交媒體上關于“哪個職業(yè)先被替代”的討論如火如荼,大家擔憂著自己的職業(yè)生涯即將被冰冷的機器人終結。
技術進步與勞動力就業(yè)關系的討論由來已久。1980年計算機開始普及,《紐約時報》曾憂心忡忡:“打字員將在10年內消失?!奔夹g水平的發(fā)展使得越來越多標準化的工作崗位面臨自動化壓力。11月6日,市場研究機構Forrester Research發(fā)布報告稱,到2029年,機器人流程自動化和人工智能技術,將為40%以上的公司創(chuàng)造出數字工人,屆時,美國約有10%的工作崗位將被機器人取代。
然而,在這種擔憂焦慮情緒的另一面,也有「太低估人類智慧」的樂觀論調。
數據顯示,計算機普及后直到2024年,全球打字員崗位確實減少了60%,卻新增了2.3億個“數據錄入員”“程序員”“新媒體編輯”崗位——這些崗位都需要“用計算機工作”,而非“被計算機替代”。
而麥肯錫2024年研究預測:到2030年,人形機器人將替代全球1.2億個“純流程化崗位”(如流水線組裝、簡單分揀、基礎客服),但會創(chuàng)造1.5億個“人機協(xié)作崗位”,包括:機器人運維工程師(負責機器保養(yǎng)和故障維修)、人機交互設計師(優(yōu)化機器人與人類的配合流程)、倫理監(jiān)管員(確保機器人操作符合社會規(guī)范)等。
技術史早已證明:新工具的出現,會淘汰“低價值重復勞動”,但同時也會創(chuàng)造“高價值協(xié)作勞動”。人形機器人的普及,同樣遵循這個邏輯。更關鍵的是,創(chuàng)造出的新崗位薪資往往更高。
更有一部分人,在思考人類與機器人如何共存的哲學命題。
阿里巴巴集團董事長蔡崇信曾在一次公開對話中反問:“如果你想要一個機器人來清潔地毯,你真的希望它看起來像人類嗎?那樣我可能會害怕?!边@一觀點反映了部分人對技術形態(tài)的理性期待——功能決定形式,而非盲目追求擬人化。
中央美術學院教授費俊也提出了類似的觀點,他表示,每一次科技浪潮都伴隨著“效率神話”——技術會解放生產力,讓你有更多自由時間?!暗夥懦鰜淼臅r間會屬于你嗎?好像從來不是。多數人時間不是讓你去玩耍,只會被更多的工作填滿。
技術本身無法自動帶來人類解放,除非我們同時調整社會結構、工作模式和價值評判標準。當機器人承擔更多標準化任務時,人類是否真正獲得了更多創(chuàng)造、休閑和思考的時間,還是僅僅被卷入新的效率競賽?
人類面臨的真正挑戰(zhàn)不是與機器競爭效率,而是如何堅守和發(fā)展那些使我們之所以為人的特質:創(chuàng)造力、同理心、審美能力和對意義的追求。2025年,人們對于機器人的看法變得更加理性,在讓機器變得更像人的同時,我們更應確保人不會變得更像機器。這種平衡的藝術,將定義未來人機關系的和諧程度。
尾聲
假如去看Gartner技術成熟度曲線,會發(fā)現一個普遍的趨勢:一個產業(yè)要正常發(fā)展,不可避免要經歷波峰波谷現象,從技術萌芽期、期望膨脹期、泡沫破裂低谷期,再到穩(wěn)步爬升恢復期、生產成熟期,這是每個行業(yè)發(fā)展都存在的周期性。

圖源:Gartner
既然如此,眼前的狂熱與爭議便不足為奇。資本如潮水般涌入,催生了繁榮,也堆起了泡沫。但在風險可控的情況下,適度的泡沫或者發(fā)展困境是可以接受的,甚至是必要的。關鍵在于如何促進產業(yè)進步、技術突破以及如何吸引更多優(yōu)秀人才參與具身智能的研究之中。
這場“AI長出四肢”的革命,最終考驗的或許不是機器能變得多像人,而是人類能否借此契機,變得更加像“人”——更智慧地規(guī)劃技術路徑,更有遠見地構建協(xié)作框架,更堅定地捍衛(wèi)那些無法被算法量化的價值。

