具身智能2025：從“玩具”到“同事”，一場矚目的成人禮|界面新聞

文 | DoNews 雁秋

編輯 | 李信馬

說起2025年的科技與產業(yè)領域，具身智能是繞不開的關鍵詞。它是怎么被公眾記住的呢？蛇年春晚舞臺應該是一切的起點，16臺人形機器人首次完成真正意義上的“破圈”，拉開一場具身智能風暴。

在專業(yè)視角下，具身智能被理解為一種擁有物理身體、能通過感知環(huán)境并自主決策、進而與動態(tài)世界交互的智能實體。它不僅代表人工智能從虛擬向實體的“范式躍遷”，也被視為人工智能與機器人學的深度融合。

圖源：蛇年春晚宇樹機器人

2025年，具身智能被寫入《政府工作報告》，二十屆四中全會審議通過的“十五五”規(guī)劃建議將其列為前瞻布局的未來產業(yè)之一，標志著國家對這一前沿技術戰(zhàn)略價值的正式認可。

2025年，具身智能成為廠商押注、資本涌入的核心戰(zhàn)場，相關板塊熱潮涌動，相關概念持續(xù)升溫。據開源證券統(tǒng)計，中國具身智能領域融資總金額已超過500億元，融資事件超過200起，較2024年全年增長超400%。

2025年，一大批具身智能產品從虛擬的數字世界走進真實的物理空間：有的可以走進工廠組裝、搬運，有的化身廚師烹飪、制作咖啡，有的能夠講解接待、提供文娛商演，有的甚至可以給老人洗發(fā)、做艾灸......

我們站在這場風暴的起點，看到企業(yè)一步步從展示炫酷Demo到驗證技術、打磨產品、尋找場景。資本涌入、場景落地交織在一起，共同推動這個“AI長出四肢”的交叉物種走出實驗室。

但隱憂并未消散，產業(yè)仍面臨模型、本體與數據的挑戰(zhàn)，具身智能遠未達到泛化能力。技術鏈條的成熟性、市場預期是否過熱以及人機共存的未來將會如何，還有很多可以討論的空間。

01、關鍵詞：技術——從理解世界到自主行動

具身智能在2025年的最顯著變化，是技術架構的轉變。

根據世界機器人大會發(fā)布的《2025具身智能機器人十大發(fā)展趨勢》，具身智能正從「物理實踐、物理模擬器與世界模型協(xié)同驅動的具身感認知」到「多層次端到端的具身決策」全方位演進。

想要理解這句話是什么意思，我們需要簡單拆分下，了解物理實踐、物理模擬器、世界模型，以及多層次端到端的概念。

想象一下，你要求家庭機器人“把餐桌收拾干凈”。對人類來說，這是簡單的指令，但機器人需要識別各種物品、理解“收拾”的含義、規(guī)劃動作順序，并應對突發(fā)情況——比如移動的寵物或滑落的餐具。

實現這一目標的核心，不僅要依托大模型的算法，還要將機器的身體結構以及與環(huán)境的互動緊密關聯(lián)起來。這就要求機器人要建立對物理世界的認知基礎，就像人類嬰兒通過觸摸、觀察和互動來學習世界運行規(guī)律的過程。

物理實踐，是機器人學習的根本途徑，是讓機器人在與真實環(huán)境的互動中積累經驗，理解物體屬性、力學規(guī)律和動作后果。

物理模擬器，可以看做一個高效“訓練場”，機器人可以在高保真的虛擬環(huán)境中進行數百萬次試錯學習，加速技能掌握。

世界模型，則是機器人的“想象力引擎”。它通過從海量數據中提煉環(huán)境運行規(guī)律，使機器人能在行動前進行“思維”，預測不同行動可能產生的結果。

當機器人具備了基本的世界理解能力后，挑戰(zhàn)就轉向如何將這些理解轉化為實際行動——這正是“多層次端到端的具身決策”要解決的問題。

多模態(tài)大模型在這一轉變中扮演了關鍵角色，它能夠整合視覺、語言、觸覺等多種信息，理解復雜指令的深層含義，并生成相應的行動計劃。就像是給具身智能嵌入了“大腦”，讓其推理、交互等方面的智能水平明顯提升。

在這一技術范式下，兩種主流架構并行發(fā)展：端到端的具身模型（例如VLA）和分層決策模型，它們代表了兩種截然不同的技術哲學。

端到端具身模型：可實現直接端到端的從人類指令到機器執(zhí)行，即輸入是圖像及文本指令，輸出的是動作。
分層決策模型：大模型擔任指揮官，傳統(tǒng)控制技術充當執(zhí)行者。這是目前主流的工程化思路，其核心在于將“思考”與“執(zhí)行”解耦，形成清晰的決策鏈條。

未來的趨勢并非簡單的二選一，而是走向分層與端到端的有機融合。一方面，高層任務規(guī)劃和語義理解將保持模塊化以確?？山忉屝裕涣硪环矫?，底層技能的執(zhí)行將通過端到端學習或“世界模型”的訓練，變得越來越通用、靈活和自適應。

需要注意的是，在2025年，數據基礎依舊是具身智能發(fā)展的關鍵瓶頸與突破點。具身智能需要上億條訓練數據才能達到完全自主水平，但現有公開數據集最大僅在百萬量級。

為解決這一難題，產業(yè)界正從兩個方向努力：基于物理實體采集與仿真合成構建大規(guī)模高質量具身智能數據集。與此同時，科研界期望在保證質量的前提下，讓數據規(guī)模“變小”，通過更高效的數據利用提升訓練效率。

可以預測，2026年能搶到數據話語權的企業(yè)，日子不會過得太差。

02、關鍵詞：產業(yè)——頭部差異化路徑與競爭格局

2025年，國家政策對具身智能產業(yè)的支持力度達到新高，具身智能首次被寫入政府工作報告，成為國家未來產業(yè)重點培育方向。與此同時，北京、上海、深圳等地同步發(fā)力，通過設立千億級產業(yè)基金、開展核心技術攻關專項、完善基礎設施配套等舉措，形成了“國家-地方”協(xié)同推進的產業(yè)發(fā)展格局。

摩根士丹利統(tǒng)計顯示，2025年下半年，中國具身智能廠商披露的訂單總額已超20億元。具身智能行業(yè)正站在產業(yè)化的門檻上。

伴隨著“訂單潮”，行業(yè)競爭從產品層面升級至生態(tài)層級，不同類型的具身智能企業(yè)選擇了差異化的發(fā)展路徑，形成了多元化的產業(yè)生態(tài)——工業(yè)派、技術派以及場景派。

工業(yè)派

深耕制造，追求群體智能與高效生產，以優(yōu)必選、智平方為代表。

優(yōu)必選提出的「群腦網絡軟件架構」，推動工業(yè)人形機器人從單機自主向群體智能進化。目前已與東風柳汽、吉利汽車、比亞迪等多家車企達成合作。

智平方走通了“模型+場景”的閉環(huán)路徑，在汽車制造、生物科技、半導體制造等多個高價值場景實現商業(yè)落地。公司與華熙生物合作，部署機器人在無菌車間執(zhí)行物料轉運、智能拆包等任務；2025年4月發(fā)布全域全身VLA大模型，并與東風柳汽合作，將機器人應用于汽車制造全場景。

圖源：優(yōu)必選官網

技術派

專注于核心模型與算法突破，探索通用智能邊界，以宇樹科技、智元為代表。

智元在2025年推出了全球首個“個人機器人”啟元Q1，主要面向極客玩家、家庭以及科研教育等用戶。這款小尺寸全身力控人形機器人可以折疊后裝進雙肩包，極大地降低了科研試錯成本。

宇樹科技則持續(xù)優(yōu)化機器人運動控制能力。在第七屆北京智源大會上，宇樹G1展示了敏捷的格斗動作，以及出色的語音對話、環(huán)境感知和行動決策能力。CEO王興興明確表示，這些表演性展示并非終極目標，解放人類生產力才是機器人的使命。

場景派

深入垂直行業(yè)，解決具體痛點，以云深處科技為代表。

云深處啟動A股上市輔導，主要產品包括四足機器人、人形機器人及核心零部件，四足機器人已實現上下樓梯、自主導航等功能，應用于電力巡檢、應急救援等領域。目前，其絕影X30四足機器人已在電力巡檢場景中實現1000+小時平均無故障工作，并能夠自主判斷電量前往充電樁充電。

更令人印象深刻的是，云深處的機器人深入可可西里無人區(qū)，偽裝成“機器藏羚羊”近距離觀察野生動物，展現了在極端環(huán)境下的卓越適應能力。

2025年10月，《具身智能產業(yè)圖譜》正式發(fā)布，清晰呈現了產業(yè)生態(tài)布局、上下游協(xié)同關系及重點企業(yè)分布，為從業(yè)者提供了全景式產業(yè)“導航儀”。在應用場景拓展方面，2025年科技創(chuàng)變者大會發(fā)布了“具身智能行業(yè)十大應用場景”，覆蓋物流、零售、制造、海洋、能源等關鍵領域。

產業(yè)落地的速度令人矚目。智元機器人預計2025年真實出貨量超5000臺，銷售額超10億元。優(yōu)必選Walker系列人形機器人2025年全年訂單總金額已達到13億元（不含全尺寸科研教育人形機器人“天工行者”及小型人形機器人“AI悟空”）。其工業(yè)人形機器人產能已達到每月300臺，預期全年交付量將超過500臺。

但現實情況是，核心挑戰(zhàn)依然存在。摩根士丹利的報告指出，許多廠商高調宣布的“大額訂單”中，相當一部分屬于框架協(xié)議或意向訂單，而非確定性的采購合同，且產能不足成為行業(yè)普遍痛點。

政策層面也提出了要求，國家發(fā)改委在2025年11月27日的新聞發(fā)布會上明確指出，隨著新興資本加速入場，需要“著力防范重復度高的產品‘扎堆’上市、研發(fā)空間被壓縮等風險”。這意味著，缺乏核心技術、僅靠組裝和模仿的企業(yè)生存空間將急劇縮小。

03、關鍵詞：市場——從“表演經濟”到“價值創(chuàng)造”

若用一個詞來形容2025年具身智能在資本市場的發(fā)展狀態(tài)，“狂熱”或許最為貼切。

據不完全統(tǒng)計，2025年前三季度，國內機器人行業(yè)新增一級市場融資事件達610筆，融資總額約500億元，是去年同期的2.5倍。創(chuàng)投數據平臺IT桔子顯示，截至12月18日，2025年至少有165家具身智能企業(yè)完成303次融資，累計融資金額近370億元，較2024年全年增長近260%。

資本火熱下注的同時，具身智能在2025年也完成了表演型到實用型的轉變。

上半年，從蛇年春晚舞臺上人形機器人的表演，到深圳地鐵智能安檢機器人上崗，再到全球首個人形機器人馬拉松在北京開跑，這些高調亮相不僅吸引了公眾目光，也為行業(yè)帶來了前所未有的關注度。

這一時期，具身智能的價值主要體現在吸引投資、提升品牌和公眾教育上。諸如舞蹈、握手、倒立、拳擊等互動，程序高度預設，環(huán)境被嚴格控制。機器人被要求“完成即勝利”，不計成本和穩(wěn)定性。

這種以“炫技”為導向的發(fā)展模式很快顯露出其局限性，有人直言，這種表演更像是打著改變人類生活口號而建的秀場。

轉變發(fā)生在多模態(tài)大模型的落地，這一技術使得機器人可以不再依賴預設程序執(zhí)行任務，而是具備了在開放環(huán)境中理解意圖、規(guī)劃動作、應對擾動的能力。

這一時期，具身智能的核心是融入生產流與服務鏈，解決具體問題并證明經濟性，價值直接體現在降本、增效、提升安全與質量。比如在工廠，工人只需對機器人說“把那個有毛刺的零件挑出來返工”，機器人便可通過視覺識別、路徑規(guī)劃自主完成全套動作。

在2025世界機器人大會上，我們看到了可視化的進展。200余家國內外企業(yè)集中展示了落地成果，機器人不再是整齊劃一的靜態(tài)陳列，而是進入高重復、高危、高成本的場景，從單純的生產工具，轉變?yōu)榧鎮(zhèn)鋽祿杉?、經驗沉淀乃至智能貢獻的“全能選手”。

圖源：DoNews攝

比如開普勒的人形機器人K2“大黃蜂”完成了8小時連續(xù)直播工作，模擬了物流分揀、搬運等場景，其研發(fā)團隊將8小時續(xù)航設定為「從實驗室樣機走向商用產品」的關鍵一步，旨在適配朝九晚五的班次需求。

在工程場景之外，機器人還進入到其他有趣且與普通人密切相關的場景。

跨維智能的人形機器人 DexForce W1 Pro 在沖咖啡時展現出穩(wěn)定的長線程工作能力。在機器人準備放置膠囊時，卻被工作人員突然拿走，但它并未宕機或陷入混亂，而是短暫地停頓，雙眼攝像頭重新掃描桌面，幾秒后，定位目標，再次精準取回膠囊，繼續(xù)后續(xù)的任務。

京東通過JoyInside平臺，將機器人部署在零售、家居等真實場景中交互和銷售，2025年“618”期間其智能機器人銷售額大幅增長；美團與合作伙伴打造全球首個人形機器人智慧藥房，實現24小時無人化藥品揀選和交付，旨在降低服務履約成本。

這些都證明了機器人已經可以在生活中給人們提供便利。

與此同時，更多場景的應用推動機器人公司的業(yè)績增長。宇樹科技王興興公開表示，公司2024年度營收規(guī)模已達到約10億元。該公司近日已完成IPO輔導，智元機器人已完成股改，還有樂聚機器人正在IPO輔導中。

04、關鍵詞：認知——從“替代恐懼”到“價值審視”

假設機器人全面進入人類的生活，那會是什么樣子？

電視劇《世界奇妙物語》描繪過這樣的畫面：在劇中，代替人類的機器人每天重復著相似的言行，去完成常規(guī)的工作任務，而人類只需穿戴智能設備，長年在睡眠艙中過上夢寐以求的日子……

然而在現實生活中，人們對機器人的到來首先感到的是「恐懼」。2025年初，社交媒體上關于“哪個職業(yè)先被替代”的討論如火如荼，大家擔憂著自己的職業(yè)生涯即將被冰冷的機器人終結。

技術進步與勞動力就業(yè)關系的討論由來已久。1980年計算機開始普及，《紐約時報》曾憂心忡忡：“打字員將在10年內消失?！奔夹g水平的發(fā)展使得越來越多標準化的工作崗位面臨自動化壓力。11月6日，市場研究機構Forrester Research發(fā)布報告稱，到2029年，機器人流程自動化和人工智能技術，將為40%以上的公司創(chuàng)造出數字工人，屆時，美國約有10%的工作崗位將被機器人取代。

然而，在這種擔憂焦慮情緒的另一面，也有「太低估人類智慧」的樂觀論調。

數據顯示，計算機普及后直到2024年，全球打字員崗位確實減少了60%，卻新增了2.3億個“數據錄入員”“程序員”“新媒體編輯”崗位——這些崗位都需要“用計算機工作”，而非“被計算機替代”。

而麥肯錫2024年研究預測：到2030年，人形機器人將替代全球1.2億個“純流程化崗位”（如流水線組裝、簡單分揀、基礎客服），但會創(chuàng)造1.5億個“人機協(xié)作崗位”，包括：機器人運維工程師（負責機器保養(yǎng)和故障維修）、人機交互設計師（優(yōu)化機器人與人類的配合流程）、倫理監(jiān)管員（確保機器人操作符合社會規(guī)范）等。

技術史早已證明：新工具的出現，會淘汰“低價值重復勞動”，但同時也會創(chuàng)造“高價值協(xié)作勞動”。人形機器人的普及，同樣遵循這個邏輯。更關鍵的是，創(chuàng)造出的新崗位薪資往往更高。

更有一部分人，在思考人類與機器人如何共存的哲學命題。

阿里巴巴集團董事長蔡崇信曾在一次公開對話中反問：“如果你想要一個機器人來清潔地毯，你真的希望它看起來像人類嗎？那樣我可能會害怕?！边@一觀點反映了部分人對技術形態(tài)的理性期待——功能決定形式，而非盲目追求擬人化。

中央美術學院教授費俊也提出了類似的觀點，他表示，每一次科技浪潮都伴隨著“效率神話”——技術會解放生產力，讓你有更多自由時間?！暗夥懦鰜淼臅r間會屬于你嗎？好像從來不是。多數人時間不是讓你去玩耍，只會被更多的工作填滿。

技術本身無法自動帶來人類解放，除非我們同時調整社會結構、工作模式和價值評判標準。當機器人承擔更多標準化任務時，人類是否真正獲得了更多創(chuàng)造、休閑和思考的時間，還是僅僅被卷入新的效率競賽？

人類面臨的真正挑戰(zhàn)不是與機器競爭效率，而是如何堅守和發(fā)展那些使我們之所以為人的特質：創(chuàng)造力、同理心、審美能力和對意義的追求。2025年，人們對于機器人的看法變得更加理性，在讓機器變得更像人的同時，我們更應確保人不會變得更像機器。這種平衡的藝術，將定義未來人機關系的和諧程度。

尾聲

假如去看Gartner技術成熟度曲線，會發(fā)現一個普遍的趨勢：一個產業(yè)要正常發(fā)展，不可避免要經歷波峰波谷現象，從技術萌芽期、期望膨脹期、泡沫破裂低谷期，再到穩(wěn)步爬升恢復期、生產成熟期，這是每個行業(yè)發(fā)展都存在的周期性。

圖源：Gartner

既然如此，眼前的狂熱與爭議便不足為奇。資本如潮水般涌入，催生了繁榮，也堆起了泡沫。但在風險可控的情況下，適度的泡沫或者發(fā)展困境是可以接受的，甚至是必要的。關鍵在于如何促進產業(yè)進步、技術突破以及如何吸引更多優(yōu)秀人才參與具身智能的研究之中。

這場“AI長出四肢”的革命，最終考驗的或許不是機器能變得多像人，而是人類能否借此契機，變得更加像“人”——更智慧地規(guī)劃技術路徑，更有遠見地構建協(xié)作框架，更堅定地捍衛(wèi)那些無法被算法量化的價值。

文 | DoNews 雁秋

編輯 | 李信馬

圖源：蛇年春晚宇樹機器人