文|極智GeeTech
沒人知道人工智能的終局是什么,但科技巨頭都在瘋狂下注。
2025年秋,“物理AI”走到人工智能舞臺中央,成為全球科技企業(yè)競相角逐的焦點(diǎn)。
當(dāng)英偉達(dá)站在5萬億美元市值的門口,物理AI成為了那塊敲門磚。在今年GTC大會上,黃仁勛系統(tǒng)闡述了物理AI技術(shù)戰(zhàn)略,同時公布量子計算、6G網(wǎng)絡(luò)等前沿領(lǐng)域的重大布局。
在主題為“涌現(xiàn)Emergence”的2025小鵬科技日上,小鵬汽車勾勒出物理AI在未來出行的清晰圖景,并且圍繞物理AI發(fā)布了第二代VLA、Robotaxi、全新一代人形機(jī)器人IRON,以及小鵬匯天飛行體系四項(xiàng)重要應(yīng)用。
一場席卷全球的物理AI競賽已全面打響,從硅谷到中國,科技巨頭們正以千億級投入爭奪下一個技術(shù)時代的話語權(quán)。
物理AI落地三大關(guān)鍵環(huán)節(jié)
2020年,瑞士聯(lián)邦材料科學(xué)與技術(shù)實(shí)驗(yàn)室Aslan Miriyev與倫敦帝國理工學(xué)院Mirko Kovac在《Nature Machine Intelligence》首次提出“物理AI”概念,強(qiáng)調(diào)機(jī)體、控制、感知等要素的協(xié)同演進(jìn)。
2024年,英偉達(dá)首席執(zhí)行官黃仁勛將其視為AI發(fā)展的核心方向,提出通過感知、推理和行動鏈實(shí)現(xiàn)物理交互能力。
物理AI將人工智能從“數(shù)字理解”推向“物理交互”的維度跨越,已成為衡量科技企業(yè)核心競爭力的新標(biāo)尺,其落地依賴三大關(guān)鍵環(huán)節(jié):虛擬環(huán)境的物理建模與訓(xùn)練、高質(zhì)量物理數(shù)據(jù)的生成與推理、真實(shí)場景的感知與決策閉環(huán)。

虛擬建模是物理AI的基礎(chǔ),其核心是通過融合經(jīng)典物理定律與深度學(xué)習(xí),構(gòu)建與真實(shí)世界高度一致的仿真環(huán)境,主要通過生成式物理引擎和強(qiáng)化學(xué)習(xí)技術(shù)實(shí)現(xiàn),結(jié)合神經(jīng)網(wǎng)絡(luò)模擬物理規(guī)律并生成訓(xùn)練數(shù)據(jù)。
生成式物理引擎融合經(jīng)典物理定律(力學(xué)、熱力學(xué)等)與深度學(xué)習(xí),構(gòu)建多物理場耦合的仿真系統(tǒng),支持剛體、流體、電磁等多場景的動態(tài)模擬,這其中需要平衡仿真精度與實(shí)時性,同時具備可擴(kuò)展性,能適配不同復(fù)雜度的物理場景(從簡單運(yùn)動到復(fù)雜材料交互)。高精度建模與實(shí)時計算存在天然矛盾,需通過算法優(yōu)化(如分層積分、動態(tài)阻尼調(diào)整)縮小差距。
物理AI的性能依賴于高質(zhì)量數(shù)據(jù)的支撐,而“合成數(shù)據(jù)+真實(shí)數(shù)據(jù)”的虛實(shí)融合模式,解決了真實(shí)物理數(shù)據(jù)稀缺、標(biāo)注困難的痛點(diǎn)。高質(zhì)量數(shù)據(jù)的生成與推理主要依賴于物理建模、數(shù)據(jù)采集技術(shù)和生成模型的結(jié)合,通過真實(shí)數(shù)據(jù)采集、物理約束優(yōu)化和算法生成等方式實(shí)現(xiàn)。
該環(huán)節(jié)通過物理引擎生成合成數(shù)據(jù),并結(jié)合生成式AI擴(kuò)展數(shù)據(jù)多樣性;推理階段需要嵌入物理約束,實(shí)現(xiàn)對物體運(yùn)動、交互關(guān)系的預(yù)測與歸因。其中,數(shù)據(jù)需要滿足“物理真實(shí)性”(符合客觀規(guī)律)與 “分布全面性”(覆蓋極端場景與邊界條件)要求,推理過程需具備可解釋性,而非純黑盒預(yù)測。挑戰(zhàn)在于合成數(shù)據(jù)與真實(shí)數(shù)據(jù)存在域差距,需通過數(shù)據(jù)增強(qiáng)、虛實(shí)融合技術(shù)縮小差異,同時物理數(shù)據(jù)的高效推理對算力與算法架構(gòu)提出了更高要求。
物理AI的最終價值在于落地真實(shí)場景,真實(shí)場景中的感知與決策閉環(huán)主要依賴于多模態(tài)數(shù)據(jù)融合、端到端模型架構(gòu)和實(shí)時算力支持,通過感知環(huán)境、理解意圖、快速決策和精準(zhǔn)執(zhí)行實(shí)現(xiàn)閉環(huán)。

該環(huán)節(jié)將虛擬訓(xùn)練的模型與真實(shí)物理世界對接,完成“感知-決策-執(zhí)行-反饋”的閉環(huán)迭代,讓AI適配真實(shí)環(huán)境的不確定性。多傳感器融合(視覺、力控、慣性測量等)實(shí)現(xiàn)環(huán)境與物體狀態(tài)的精準(zhǔn)感知;決策算法需結(jié)合模型預(yù)測控制與強(qiáng)化學(xué)習(xí),兼顧實(shí)時性與魯棒性。而真實(shí)環(huán)境的復(fù)雜性(非結(jié)構(gòu)化、動態(tài)變化)遠(yuǎn)超虛擬場景,需要解決模型泛化能力不足的問題,同時端側(cè)部署需要進(jìn)一步平衡推理速度、精度與硬件功耗。
海外科技巨頭的戰(zhàn)略卡位
當(dāng)物理AI已成為人工智能領(lǐng)域下一個關(guān)鍵賽點(diǎn),全球科技巨頭憑借各自優(yōu)勢,形成了特色鮮明的發(fā)展路徑。
在巴塞羅那智慧城市博覽會世界大會上,英偉達(dá)集中展示物理AI應(yīng)用成果,其整合Omniverse、Cosmos和Metropolis等平臺,不僅能模擬真實(shí)世界環(huán)境,還能生成合成數(shù)據(jù)、訓(xùn)練視覺語言模型(VLM),并通過AI代理分析城市視頻流,形成一個從數(shù)據(jù)到?jīng)Q策的完整生態(tài)閉環(huán)。
針對真實(shí)場景訓(xùn)練成本高、風(fēng)險大(如機(jī)器人高危作業(yè)測試、飛行器氣動實(shí)驗(yàn))的痛點(diǎn),Omniverse通過“高精度物理建模+數(shù)字孿生”提供解決方案,不僅可以模擬重力、摩擦力、流體力學(xué)等多物理場效應(yīng),還能支持機(jī)器人硬件設(shè)計與算法驗(yàn)證的虛擬化,縮短原型迭代周期。
物理AI面臨的第二個痛點(diǎn)是數(shù)據(jù)枯竭危機(jī),需要附帶物理屬性的高質(zhì)量數(shù)據(jù),Cosmos通過“生成式建模+物理推理”雙重能力突破瓶頸,其通過文本、圖像輸入生成物理逼真的視頻數(shù)據(jù),解決了傳統(tǒng)VLM無法處理多步驟物理任務(wù)的缺陷,可以基于先驗(yàn)知識預(yù)判物理變化,自主推理下一步驟或動作。
在動態(tài)現(xiàn)實(shí)場景中,物理AI需要低延遲感知和實(shí)時決策(如自動駕駛避障、智慧城市交通調(diào)度),Metropolis 通過“邊緣視覺分析+算力協(xié)同”構(gòu)建感知底座,既可以通過感知設(shè)備進(jìn)行多模態(tài)物理動態(tài)捕捉,還能在邊緣端進(jìn)行實(shí)時推理加速秒,滿足物理AI毫秒級動作生成需求。
谷歌DeepMind走出了通用智能的路線。今年9月,DeepMind正式發(fā)布新一代通用機(jī)器人基座模型——Gemini Robotics 1.5系列。這一系列由兩大模型組成:Gemini Robotics 1.5(GR 1.5)負(fù)責(zé)動作執(zhí)行的多模態(tài)大模型;Gemini Robotics-ER 1.5(GR-ER 1.5)強(qiáng)化推理能力,提供規(guī)劃與理解支持。其中,ER代表“具身推理”。該系列模型不止于對語言、圖像進(jìn)行理解,還結(jié)合了視覺、語言與動作(VLA),并通過具身推理來實(shí)現(xiàn)“先思考,再行動”。
兩者結(jié)合,能讓機(jī)器人不僅完成折紙、解袋子這樣的單一動作,還能解決分揀深淺色衣物、根據(jù)某地天氣自動打包行李這種需要理解外部信息、分解復(fù)雜流程的多步任務(wù)。它甚至還能根據(jù)特定地點(diǎn)的特定要求(比如北京和上海的不同垃圾分類標(biāo)準(zhǔn)),自己上網(wǎng)搜索,以幫助人們完成垃圾分類。該模型還能夠在多種不同的機(jī)器人之間進(jìn)行能力的零樣本跨平臺遷移。
特斯拉則堅(jiān)持產(chǎn)品驅(qū)動策略,Optimus二代機(jī)器人搭載自研的物理引擎,其擁有22個自由度的靈巧手能夠完成疊襯衫、在工廠分揀物品等任務(wù),還能將千萬輛特斯拉汽車的駕駛數(shù)據(jù)轉(zhuǎn)化為物理AI訓(xùn)練素材,形成出行場景反哺機(jī)器人研發(fā)的獨(dú)特閉環(huán)。馬斯克對Optimus項(xiàng)目寄予厚望,他設(shè)定了一個極其激進(jìn)的目標(biāo),計劃到今年年底便生產(chǎn)多達(dá)5000臺Optimus機(jī)器人。
今年6月,亞馬遜宣布將在其神秘的硬件研發(fā)部門Lab126內(nèi)組建一支新的Agentic AI團(tuán)隊(duì),開始物理AI的研發(fā)工作。這一決定標(biāo)志著亞馬遜正式進(jìn)軍物理AI的研發(fā)領(lǐng)域,特別是針對機(jī)器人技術(shù)的深度探索。
亞馬遜倉庫中的崗位,可能會成為首批受到物理AI影響的領(lǐng)域。近期,亞馬遜發(fā)布了一款名為“Blue Jay”的新型多功能倉庫機(jī)器人系統(tǒng),并透露其已在美國南卡羅來納州的一處倉庫投入測試。Blue Jay整合了揀選、分類和整合包裹等多個環(huán)節(jié),旨在將此前三個獨(dú)立的機(jī)器人工作站合而為一。
亞馬遜計劃到2027年實(shí)現(xiàn)75%倉儲物流自動化,或減少超50萬崗位招聘,節(jié)省126億美元人力成本。
除了Blue Jay,亞馬遜還推出了另外兩項(xiàng)技術(shù)創(chuàng)新。其中之一是名為“Project Eluna”的代理式AI系統(tǒng),旨在為運(yùn)營經(jīng)理提供決策支持。該系統(tǒng)可以整合歷史和實(shí)時數(shù)據(jù),預(yù)測運(yùn)營瓶頸并向操作員推薦解決方案。另一項(xiàng)創(chuàng)新是為配送司機(jī)設(shè)計的增強(qiáng)現(xiàn)實(shí)AR眼鏡。這款眼鏡集成了人工智能、傳感器和攝像頭,可在司機(jī)視野內(nèi)疊加路線導(dǎo)航、危險提醒(如提示客戶住處有狗)等信息,并能掃描包裹。
物理AI重塑生產(chǎn)力
這場全球競賽的背后,是物理AI重塑生產(chǎn)力格局的巨大潛能。
Gartner拋出重磅預(yù)測,到2030年,IT部門的所有工作都將與AI深度綁定,AI將徹底重塑傳統(tǒng)工作模式與人才需求格局。其中,未來五年內(nèi),25%的IT工作將完全由機(jī)器人獨(dú)立執(zhí)行,剩余75%的工作則需人類從業(yè)者借助AI工具協(xié)同完成。
物理AI的終極價值,在于將人類從重復(fù)物理勞動中解放出來。當(dāng)Robotaxi自動完成城市通勤、機(jī)器人承擔(dān)高危作業(yè)、飛行汽車打通低空通道,人類得以專注于創(chuàng)意、研發(fā)等更高價值的活動。這種生產(chǎn)力解放帶來的將是生產(chǎn)力的巨大躍升,當(dāng)每個機(jī)器都能理解物理世界,人類將獲得前所未有的自由。
在工業(yè)領(lǐng)域,物理AI核心在于將傳統(tǒng)“剛性自動化”升級為“柔性自主化”,實(shí)現(xiàn)生產(chǎn)全流程的效率躍遷與成本優(yōu)化。其變革邏輯圍繞“數(shù)字孿生訓(xùn)練場+自主決策機(jī)器人+全鏈路協(xié)同優(yōu)化”三大支柱展開。
數(shù)字孿生技術(shù)讓工廠擺脫了物理試錯的低效模式,將工業(yè)設(shè)計、工業(yè)制造的每一個細(xì)節(jié)都能在虛擬空間完成仿真優(yōu)化,大幅縮短生產(chǎn)周期,降低產(chǎn)品投產(chǎn)初期故障率。更關(guān)鍵的是,物理仿真與AI的深度融合解決了傳統(tǒng)工業(yè)機(jī)器人不會思考的痛點(diǎn),通過仿真環(huán)境,機(jī)器人可在虛擬空間完成百萬次場景訓(xùn)練——從倉儲分揀到設(shè)備檢修,從零件裝配到故障排查,無需占用真實(shí)產(chǎn)能即可形成最優(yōu)操作策略。
全鏈路協(xié)同優(yōu)化讓生產(chǎn)力提升從單點(diǎn)突破走向系統(tǒng)升級。通過決策優(yōu)化平臺內(nèi)置的預(yù)設(shè)算法模塊,可使生產(chǎn)計劃調(diào)整響應(yīng)時間從數(shù)小時縮短至十分鐘,綜合生產(chǎn)成本得到進(jìn)一步降低。
在交通和能源這兩大關(guān)乎國計民生的領(lǐng)域,物理AI正通過對復(fù)雜物理系統(tǒng)的精準(zhǔn)控制,同時解決效率低下與安全風(fēng)險兩大痛點(diǎn),重塑行業(yè)生產(chǎn)力格局。
在自動駕駛領(lǐng)域,物理AI是從“實(shí)驗(yàn)室演示”邁向“商業(yè)化落地”的關(guān)鍵,解決了真實(shí)道路的復(fù)雜性與不確定性。依托于“多傳感器融合+物理世界模型+超強(qiáng)算力”的架構(gòu),自動駕駛系統(tǒng)能夠精準(zhǔn)感知路面狀況、車輛位置和行人動態(tài),破解了傳統(tǒng)自動駕駛在極端天氣和突發(fā)狀況下感知及決策精準(zhǔn)性的難題。

物理AI將交通生產(chǎn)力從單車載運(yùn)升級為集群化智能調(diào)度,通過MogoMind等物理世界多模態(tài)大模型,自動駕駛車隊(duì)可實(shí)現(xiàn)路徑動態(tài)規(guī)劃、運(yùn)力實(shí)時調(diào)配,進(jìn)一步城市出行效率,降低物流運(yùn)輸成本,徹底改變傳統(tǒng)交通系統(tǒng)“各自為戰(zhàn)”的低效模式。
在能源領(lǐng)域,物理AI正在推動清潔能源從“間歇性供給”轉(zhuǎn)向“穩(wěn)定化輸出”,優(yōu)化能源利用效率。物理AI可以根據(jù)實(shí)時用電負(fù)荷、新能源發(fā)電功率和輸電線路損耗數(shù)據(jù),動態(tài)調(diào)整電力分配策略,降低電網(wǎng)損耗,提升新能源消納率。
盡管物理AI已取得顯著進(jìn)展,但要全面重塑生產(chǎn)力,仍需突破三大核心挑戰(zhàn)。
首先,物理AI與實(shí)體系統(tǒng)深度耦合,其決策失誤可能導(dǎo)致生產(chǎn)事故、醫(yī)療風(fēng)險等嚴(yán)重后果,但全球尚未形成統(tǒng)一的物理AI安全標(biāo)準(zhǔn)。
其次,仿真環(huán)境與真實(shí)世界的差異(如材質(zhì)、光照、干擾)仍會影響AI模型的泛化能力,Sim2Real遷移仍是技術(shù)難點(diǎn)。
其三,高端傳感器、GPU算力、定制化算法的研發(fā)成本高昂,中小企業(yè)難以負(fù)擔(dān),導(dǎo)致技術(shù)普及速度受限。
全球科技巨頭競逐物理AI,本質(zhì)上是對下一個十年技術(shù)話語權(quán)的爭奪。物理AI不僅是人工智能的升級方向,更是衡量國家科技競爭力的核心指標(biāo),它既決定著制造業(yè)高端化的進(jìn)程,也影響著未來出行、機(jī)器人等萬億級市場的格局。
到2030年,物理AI將全面滲透到生產(chǎn)生活的各個角落:工廠實(shí)現(xiàn)100%自主化生產(chǎn),農(nóng)業(yè)機(jī)器人完成從播種到收割的全流程作業(yè),自動駕駛車隊(duì)主導(dǎo)城市出行,核聚變電站提供穩(wěn)定清潔能源,AI醫(yī)生實(shí)現(xiàn)常見病的精準(zhǔn)診療。
這場關(guān)乎未來的物理AI競賽,早已超越商業(yè)層面的較量,它是數(shù)字智能向物理世界延伸的必經(jīng)之路,是人類探索智能邊界的重要一步。在這場較量中,每一次技術(shù)突破都在重塑我們與世界的交互方式,正如物理世界的規(guī)律不可逆轉(zhuǎn),這場由物理AI引發(fā)的技術(shù)浪潮,開始續(xù)寫人工智能的下一章節(jié)。

