要聞

熱度空前但拒絕盲目樂(lè)觀具身智能業(yè)界：離“ChatGPT”時(shí)刻還遠(yuǎn)

2026-02-10 21:25:55

2月10日原力靈機(jī)技術(shù)開放日上，與會(huì)者認(rèn)為具身智能遠(yuǎn)未到“ChatGPT時(shí)刻”，在模型、硬件、數(shù)據(jù)等方面仍高度未收斂，技術(shù)成熟度與產(chǎn)業(yè)現(xiàn)實(shí)存張力。對(duì)于具身智能的“ChatGPT時(shí)刻”，行業(yè)尚無(wú)共識(shí)。關(guān)于未來(lái)發(fā)展，行業(yè)形成以真機(jī)、評(píng)測(cè)與標(biāo)準(zhǔn)為落腳點(diǎn)的共識(shí)路徑，期待統(tǒng)一標(biāo)準(zhǔn)降低驗(yàn)證成本，推動(dòng)生態(tài)協(xié)同。

每經(jīng)記者｜可楊每經(jīng)編輯｜黃博文

過(guò)去一年，具身智能屢次被推向行業(yè)聚光燈中心。

一邊是融資熱潮涌動(dòng)、演示視頻刷屏出圈，機(jī)器人不斷解鎖更復(fù)雜的動(dòng)作能力；另一邊卻是落地場(chǎng)景受限、穩(wěn)定性欠佳，成本與安全性等核心問(wèn)題仍未破局的現(xiàn)實(shí)困境。

雖然行業(yè)熱度空前，但真正的問(wèn)題也開始浮現(xiàn)：具身智能究竟處在怎樣的技術(shù)階段？它距離被廣泛使用、被規(guī)模化部署還有多遠(yuǎn)？

在2月10日舉辦的原力靈機(jī)技術(shù)開放日上，圍繞Physical AI Next（下一代物理AI）展開的圓桌討論中，來(lái)自學(xué)術(shù)界、研究機(jī)構(gòu)與產(chǎn)業(yè)一線的多位參與者并未急于給出樂(lè)觀結(jié)論。

相反，“還遠(yuǎn)沒(méi)有到具身智能的‘ChatGPT時(shí)刻’”幾乎成為共識(shí)。無(wú)論是模型能力、硬件成熟度，還是數(shù)據(jù)、評(píng)測(cè)與標(biāo)準(zhǔn)體系，具身智能都仍處在高度未收斂的階段。模型路線尚在分化，真機(jī)部署暴露出的系統(tǒng)性問(wèn)題，比仿真環(huán)境中更加真實(shí)而復(fù)雜。

原力靈機(jī)技術(shù)開放日活動(dòng)現(xiàn)場(chǎng) 圖片來(lái)源：每經(jīng)記者可楊攝

“還遠(yuǎn)沒(méi)有到具身的‘ChatGPT時(shí)刻’”

具身智能正在經(jīng)歷一輪前所未有的關(guān)注度上升，但在熱度背后，技術(shù)成熟度與產(chǎn)業(yè)現(xiàn)實(shí)之間的張力被反復(fù)提及。

北京智源人工智能研究院院長(zhǎng)王仲遠(yuǎn)直言，當(dāng)前具身智能特別火熱，但火熱背后也伴隨著很多隱憂。他從硬件和模型兩個(gè)層面拆解了這種不平衡：一方面，硬件能力的進(jìn)步是肉眼可見的，機(jī)器人從“能走路”到“能跑起來(lái)”，再到“能干活”；另一方面，連續(xù)工作的穩(wěn)定性、安全性以及電池等一系列問(wèn)題仍未解決。

與此同時(shí)，王仲遠(yuǎn)也提到，當(dāng)具身智能的模型和硬件真正部署到真機(jī)后，行業(yè)才意識(shí)到，“離我們真正希望的大規(guī)模應(yīng)用還是有比較大的鴻溝”。

在模型層面，王仲遠(yuǎn)的判斷同樣謹(jǐn)慎。他指出，無(wú)論是分模塊的“VLM（視覺語(yǔ)言模型）+控制”方案或端到端的VLA（視覺-語(yǔ)言-行為大模型）方案，還是當(dāng)前研究熱度很高的世界模型，整體仍處在探索階段。

“我認(rèn)為，現(xiàn)階段還遠(yuǎn)遠(yuǎn)談不上能自豪地宣稱，具身智能已經(jīng)迎來(lái)根本性突破?！痹谕踔龠h(yuǎn)看來(lái)，更現(xiàn)實(shí)的路徑或許并非一次性解決泛化問(wèn)題，而是要在一個(gè)個(gè)真實(shí)的場(chǎng)景里，先把活干起來(lái)，累積更多的數(shù)據(jù)，形成數(shù)據(jù)閉環(huán)，最后再來(lái)解決泛化性的問(wèn)題。

從硬件的視角，清華大學(xué)電子工程系長(zhǎng)聘教授汪玉認(rèn)為，當(dāng)前機(jī)器人展示的能力大多仍局限在一個(gè)工作臺(tái)上，而一旦任務(wù)被拉長(zhǎng)，就需要大小腦配合；而一旦任務(wù)被放入真實(shí)空間，則需要跨模態(tài)工作，復(fù)雜度便急劇上升。

汪玉用從“疊一件衣服”到“收拾整個(gè)屋子”來(lái)舉例。他指出，二者之間的難度跨越絕非僅停留在執(zhí)行單一動(dòng)作層面，后者需要感知整體環(huán)境、確立任務(wù)目標(biāo)，進(jìn)而持續(xù)完成跨模態(tài)、多步驟的復(fù)雜任務(wù)。

在這個(gè)問(wèn)題上，汪玉并未將答案完全指向模型突破，而是提出了一個(gè)更底層的反問(wèn)：如果未來(lái)機(jī)器人真的要進(jìn)入人的生活空間，是否需要“這個(gè)屋子本身也要發(fā)生變化”？在他看來(lái)，當(dāng)前物理環(huán)境完全是圍繞人設(shè)計(jì)的，要求機(jī)器以100%的人類感知能力去感知和適應(yīng)并不合理。借鑒車路協(xié)同的思路，通過(guò)基礎(chǔ)設(shè)施、環(huán)境側(cè)的改造，或許能為機(jī)器智能的持續(xù)進(jìn)步提供另一條路徑。

何為具身智能的“ChatGPT時(shí)刻”尚無(wú)共識(shí)

在追問(wèn)變革是否已經(jīng)到來(lái)之前，“什么才算具身智能的‘ChatGPT時(shí)刻’”依舊是行業(yè)分歧之一。

階躍星辰創(chuàng)始人兼CEO（首席執(zhí)行官）姜大昕從大模型產(chǎn)業(yè)本身的經(jīng)驗(yàn)出發(fā)，強(qiáng)調(diào)這一時(shí)刻的核心標(biāo)志在于實(shí)現(xiàn)零樣本泛化，即模型面對(duì)以前沒(méi)有見過(guò)的情況也能理解指令并完成任務(wù)。

“如果對(duì)比自然語(yǔ)言，我覺得具身智能的‘ChatGPT時(shí)刻’會(huì)更加困難一些?！苯箨空J(rèn)為，具身智能的泛化并非單一維度，而是同時(shí)發(fā)生在場(chǎng)景、任務(wù)和目標(biāo)等多個(gè)層面。不同維度的組合導(dǎo)致“我們究竟在哪個(gè)維度上定義‘ChatGPT時(shí)刻’，還沒(méi)有形成共識(shí)”。

從技術(shù)角度看，姜大昕回顧了自然語(yǔ)言處理在Transformer（指模型架構(gòu)）出現(xiàn)前后的路徑分野。他認(rèn)為，NLP（自然語(yǔ)言處理）之所以能夠?qū)崿F(xiàn)快速躍遷，關(guān)鍵在于它解決了自監(jiān)督預(yù)訓(xùn)練的問(wèn)題，從而能夠壓縮海量互聯(lián)網(wǎng)知識(shí)，進(jìn)而能夠完成復(fù)雜任務(wù)。而在具身智能中，行業(yè)對(duì)視覺的編碼方式和3D空間的推理機(jī)制等“非常根本性的問(wèn)題”仍未形成統(tǒng)一認(rèn)知。在他看來(lái)，行業(yè)可能需要等到這些問(wèn)題有了新的突破才能真正跨越到“ChatGPT時(shí)刻”。

星海圖創(chuàng)始人兼CEO高繼揚(yáng)則給出了一個(gè)更產(chǎn)業(yè)化的判斷。他認(rèn)為，具身智能與大語(yǔ)言模型在產(chǎn)業(yè)形態(tài)上存在本質(zhì)差異：大模型的稀缺環(huán)節(jié)幾乎只在模型本身，模型即產(chǎn)品，模型好了，整個(gè)商業(yè)化、產(chǎn)業(yè)化的鏈條也都具備了；具身智能的鏈條更長(zhǎng)，零部件供應(yīng)鏈尚不成熟、整機(jī)規(guī)模不足、渠道和終端高度線下化，這些都決定了算法并不能單獨(dú)構(gòu)成拐點(diǎn)。

在這樣的前提下，高繼揚(yáng)更傾向于將具身智能的“ChatGPT時(shí)刻”理解為“在某些限定范圍內(nèi)具備商業(yè)價(jià)值的時(shí)刻”。他判斷，隨著整機(jī)、供應(yīng)鏈、數(shù)據(jù)和模型在過(guò)去兩年逐步補(bǔ)齊，2026年可能成為一個(gè)關(guān)鍵節(jié)點(diǎn)。

“2026年是形成‘應(yīng)用閉環(huán)’的一年。2025年上半年，我們明顯看到具身智能尚處于起步探索階段；2025年下半年，其發(fā)展速度迎來(lái)顯著提速。2026年有望成為具身智能技術(shù)的爆發(fā)之年，技術(shù)爆發(fā)將推動(dòng)部分應(yīng)用領(lǐng)域形成場(chǎng)景外溢效應(yīng)，并與供應(yīng)鏈、整機(jī)產(chǎn)品形成協(xié)同聯(lián)動(dòng)?！备呃^揚(yáng)表示。

原力靈機(jī)聯(lián)合創(chuàng)始人兼CEO唐文斌則進(jìn)一步降低了這一時(shí)刻的門檻。在他看來(lái)，姜大昕所定義的“ChatGPT時(shí)刻”更接近于實(shí)現(xiàn)AGI目標(biāo)（實(shí)現(xiàn)通用人工智能）。唐文斌更強(qiáng)調(diào)，具身智能的“ChatGPT時(shí)刻”，核心是要在限定場(chǎng)景中完成閉環(huán)、算清ROI（投資回報(bào)比），并實(shí)現(xiàn)規(guī)?；涞貞?yīng)用?！癈hatGPT給我們帶來(lái)最大的震撼是什么？我們?cè)?jīng)把它當(dāng)成一個(gè)玩具，但是在那一刻（即ChatGPT時(shí)刻），我們認(rèn)為它是一個(gè)工具，它變成一個(gè)可用的東西。”

在唐文斌看來(lái)，當(dāng)機(jī)器人從玩具變成工具，這一刻便已經(jīng)具備了“ChatGPT時(shí)刻”的意義。

真機(jī)評(píng)測(cè)、標(biāo)準(zhǔn)與規(guī)?；?，成為行業(yè)共識(shí)的落腳點(diǎn)

如果說(shuō)關(guān)于終極形態(tài)的判斷仍然分散，那么行業(yè)對(duì)“接下來(lái)該做什么”這一問(wèn)題則逐漸形成一條清晰的共識(shí)路徑：真機(jī)、評(píng)測(cè)與標(biāo)準(zhǔn)。

唐文斌坦言，當(dāng)前具身智能面臨的并非單點(diǎn)能力不足，而是整個(gè)技術(shù)架構(gòu)的缺失?！安还苁菙?shù)據(jù)還是硬件，我們今天在訓(xùn)練推理乃至整個(gè)鏈條上缺的東西非常多，評(píng)測(cè)也缺。”

在他看來(lái)，如果無(wú)法評(píng)測(cè)真實(shí)能力，模型就無(wú)法真正進(jìn)化，現(xiàn)有的行業(yè)榜單規(guī)模有限。“（榜單上的）九十九點(diǎn)幾分能代表當(dāng)前真實(shí)的能力嗎？顯然不能，所以我們覺得非常需要來(lái)自物理世界、基于物理世界真實(shí)的、大規(guī)模的、真機(jī)的評(píng)測(cè)，才能夠引導(dǎo)我們能夠更好向前?！?/span>

高繼揚(yáng)也提到，具身智能未來(lái)也會(huì)形成垂類的概念，而垂類一定是來(lái)自真實(shí)需求，將這些真實(shí)需求落到真機(jī)的測(cè)評(píng)中，才能給企業(yè)及需求方一個(gè)公允的迭代環(huán)境?！昂芏鄷r(shí)候AI還是實(shí)驗(yàn)科學(xué)，它有一定的原理、數(shù)學(xué)做支撐，但最終很多事還是要試出來(lái)，試這個(gè)東西就要有反饋，反饋就要有評(píng)測(cè)?！?/p>

汪玉則將這一評(píng)測(cè)體系與未來(lái)的開放生態(tài)聯(lián)系起來(lái)。他認(rèn)為，高頻、可持續(xù)的真實(shí)世界評(píng)測(cè)，比低頻的大型比賽更具推動(dòng)力，而這一體系最終應(yīng)當(dāng)以更公益、更開放的方式存在，通過(guò)開源框架、硬件、數(shù)據(jù)和評(píng)測(cè)，形成對(duì)整個(gè)行業(yè)的基礎(chǔ)支撐。

在展望2026年時(shí)，王仲遠(yuǎn)明確表示，相比模型能力的單點(diǎn)突破，他更期待在硬件、數(shù)據(jù)和模型輸出等層面形成統(tǒng)一標(biāo)準(zhǔn)，從而降低驗(yàn)證和復(fù)現(xiàn)成本，推動(dòng)生態(tài)協(xié)同。“現(xiàn)在不管是硬件的標(biāo)準(zhǔn)、數(shù)據(jù)的標(biāo)準(zhǔn)，包括模型輸出的標(biāo)準(zhǔn)，整個(gè)生態(tài)非常碎片化?！?/p>

唐文斌則將目標(biāo)聚焦在“一個(gè)場(chǎng)景、一千臺(tái)、持續(xù)運(yùn)行”這一極具操作性的指標(biāo)上。在他看來(lái)，規(guī)模化并非通過(guò)場(chǎng)景疊加實(shí)現(xiàn)，而是在單一場(chǎng)景中跑通閉環(huán)，這才意味著具身智能真正邁過(guò)產(chǎn)業(yè)化門檻。

封面圖片來(lái)源：可楊

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

上一篇文章

弘信電子董事陳素真減持4萬(wàn)股，減持金額123萬(wàn)元

返回每經(jīng)網(wǎng)首頁(yè)

下一篇文章

法國(guó)表示已在技術(shù)層面與俄羅斯恢復(fù)對(duì)話渠道

相關(guān)文章