2026-02-10 21:25:55
2月10日原力靈機(jī)技術(shù)開(kāi)放日上,與會(huì)者認(rèn)為具身智能遠(yuǎn)未到“ChatGPT時(shí)刻”,在模型、硬件、數(shù)據(jù)等方面仍高度未收斂,技術(shù)成熟度與產(chǎn)業(yè)現(xiàn)實(shí)存張力。對(duì)于具身智能的“ChatGPT時(shí)刻”,行業(yè)尚無(wú)共識(shí)。關(guān)于未來(lái)發(fā)展,行業(yè)形成以真機(jī)、評(píng)測(cè)與標(biāo)準(zhǔn)為落腳點(diǎn)的共識(shí)路徑,期待統(tǒng)一標(biāo)準(zhǔn)降低驗(yàn)證成本,推動(dòng)生態(tài)協(xié)同。
每經(jīng)記者|可楊 每經(jīng)編輯|黃博文
過(guò)去一年,具身智能屢次被推向行業(yè)聚光燈中心。
一邊是融資熱潮涌動(dòng)、演示視頻刷屏出圈,機(jī)器人不斷解鎖更復(fù)雜的動(dòng)作能力;另一邊卻是落地場(chǎng)景受限、穩(wěn)定性欠佳,成本與安全性等核心問(wèn)題仍未破局的現(xiàn)實(shí)困境。
雖然行業(yè)熱度空前,但真正的問(wèn)題也開(kāi)始浮現(xiàn):具身智能究竟處在怎樣的技術(shù)階段?它距離被廣泛使用、被規(guī)?;渴疬€有多遠(yuǎn)?
在2月10日舉辦的原力靈機(jī)技術(shù)開(kāi)放日上,圍繞Physical AI Next(下一代物理AI)展開(kāi)的圓桌討論中,來(lái)自學(xué)術(shù)界、研究機(jī)構(gòu)與產(chǎn)業(yè)一線(xiàn)的多位參與者并未急于給出樂(lè)觀(guān)結(jié)論。
相反,“還遠(yuǎn)沒(méi)有到具身智能的‘ChatGPT時(shí)刻’”幾乎成為共識(shí)。無(wú)論是模型能力、硬件成熟度,還是數(shù)據(jù)、評(píng)測(cè)與標(biāo)準(zhǔn)體系,具身智能都仍處在高度未收斂的階段。模型路線(xiàn)尚在分化,真機(jī)部署暴露出的系統(tǒng)性問(wèn)題,比仿真環(huán)境中更加真實(shí)而復(fù)雜。
原力靈機(jī)技術(shù)開(kāi)放日活動(dòng)現(xiàn)場(chǎng) 圖片來(lái)源:每經(jīng)記者 可楊 攝
具身智能正在經(jīng)歷一輪前所未有的關(guān)注度上升,但在熱度背后,技術(shù)成熟度與產(chǎn)業(yè)現(xiàn)實(shí)之間的張力被反復(fù)提及。
北京智源人工智能研究院院長(zhǎng)王仲遠(yuǎn)直言,當(dāng)前具身智能特別火熱,但火熱背后也伴隨著很多隱憂(yōu)。他從硬件和模型兩個(gè)層面拆解了這種不平衡:一方面,硬件能力的進(jìn)步是肉眼可見(jiàn)的,機(jī)器人從“能走路”到“能跑起來(lái)”,再到“能干活”;另一方面,連續(xù)工作的穩(wěn)定性、安全性以及電池等一系列問(wèn)題仍未解決。
與此同時(shí),王仲遠(yuǎn)也提到,當(dāng)具身智能的模型和硬件真正部署到真機(jī)后,行業(yè)才意識(shí)到,“離我們真正希望的大規(guī)模應(yīng)用還是有比較大的鴻溝”。
在模型層面,王仲遠(yuǎn)的判斷同樣謹(jǐn)慎。他指出,無(wú)論是分模塊的“VLM(視覺(jué)語(yǔ)言模型)+控制”方案或端到端的VLA(視覺(jué)-語(yǔ)言-行為大模型)方案,還是當(dāng)前研究熱度很高的世界模型,整體仍處在探索階段。
“我認(rèn)為,現(xiàn)階段還遠(yuǎn)遠(yuǎn)談不上能自豪地宣稱(chēng),具身智能已經(jīng)迎來(lái)根本性突破?!痹谕踔龠h(yuǎn)看來(lái),更現(xiàn)實(shí)的路徑或許并非一次性解決泛化問(wèn)題,而是要在一個(gè)個(gè)真實(shí)的場(chǎng)景里,先把活干起來(lái),累積更多的數(shù)據(jù),形成數(shù)據(jù)閉環(huán),最后再來(lái)解決泛化性的問(wèn)題。
從硬件的視角,清華大學(xué)電子工程系長(zhǎng)聘教授汪玉認(rèn)為,當(dāng)前機(jī)器人展示的能力大多仍局限在一個(gè)工作臺(tái)上,而一旦任務(wù)被拉長(zhǎng),就需要大小腦配合;而一旦任務(wù)被放入真實(shí)空間,則需要跨模態(tài)工作,復(fù)雜度便急劇上升。
汪玉用從“疊一件衣服”到“收拾整個(gè)屋子”來(lái)舉例。他指出,二者之間的難度跨越絕非僅停留在執(zhí)行單一動(dòng)作層面,后者需要感知整體環(huán)境、確立任務(wù)目標(biāo),進(jìn)而持續(xù)完成跨模態(tài)、多步驟的復(fù)雜任務(wù)。
在這個(gè)問(wèn)題上,汪玉并未將答案完全指向模型突破,而是提出了一個(gè)更底層的反問(wèn):如果未來(lái)機(jī)器人真的要進(jìn)入人的生活空間,是否需要“這個(gè)屋子本身也要發(fā)生變化”?在他看來(lái),當(dāng)前物理環(huán)境完全是圍繞人設(shè)計(jì)的,要求機(jī)器以100%的人類(lèi)感知能力去感知和適應(yīng)并不合理。借鑒車(chē)路協(xié)同的思路,通過(guò)基礎(chǔ)設(shè)施、環(huán)境側(cè)的改造,或許能為機(jī)器智能的持續(xù)進(jìn)步提供另一條路徑。
在追問(wèn)變革是否已經(jīng)到來(lái)之前,“什么才算具身智能的‘ChatGPT時(shí)刻’”依舊是行業(yè)分歧之一。
階躍星辰創(chuàng)始人兼CEO(首席執(zhí)行官)姜大昕從大模型產(chǎn)業(yè)本身的經(jīng)驗(yàn)出發(fā),強(qiáng)調(diào)這一時(shí)刻的核心標(biāo)志在于實(shí)現(xiàn)零樣本泛化,即模型面對(duì)以前沒(méi)有見(jiàn)過(guò)的情況也能理解指令并完成任務(wù)。
“如果對(duì)比自然語(yǔ)言,我覺(jué)得具身智能的‘ChatGPT時(shí)刻’會(huì)更加困難一些?!苯箨空J(rèn)為,具身智能的泛化并非單一維度,而是同時(shí)發(fā)生在場(chǎng)景、任務(wù)和目標(biāo)等多個(gè)層面。不同維度的組合導(dǎo)致“我們究竟在哪個(gè)維度上定義‘ChatGPT時(shí)刻’,還沒(méi)有形成共識(shí)”。
從技術(shù)角度看,姜大昕回顧了自然語(yǔ)言處理在Transformer(指模型架構(gòu))出現(xiàn)前后的路徑分野。他認(rèn)為,NLP(自然語(yǔ)言處理)之所以能夠?qū)崿F(xiàn)快速躍遷,關(guān)鍵在于它解決了自監(jiān)督預(yù)訓(xùn)練的問(wèn)題,從而能夠壓縮海量互聯(lián)網(wǎng)知識(shí),進(jìn)而能夠完成復(fù)雜任務(wù)。而在具身智能中,行業(yè)對(duì)視覺(jué)的編碼方式和3D空間的推理機(jī)制等“非常根本性的問(wèn)題”仍未形成統(tǒng)一認(rèn)知。在他看來(lái),行業(yè)可能需要等到這些問(wèn)題有了新的突破才能真正跨越到“ChatGPT時(shí)刻”。
星海圖創(chuàng)始人兼CEO高繼揚(yáng)則給出了一個(gè)更產(chǎn)業(yè)化的判斷。他認(rèn)為,具身智能與大語(yǔ)言模型在產(chǎn)業(yè)形態(tài)上存在本質(zhì)差異:大模型的稀缺環(huán)節(jié)幾乎只在模型本身,模型即產(chǎn)品,模型好了,整個(gè)商業(yè)化、產(chǎn)業(yè)化的鏈條也都具備了;具身智能的鏈條更長(zhǎng),零部件供應(yīng)鏈尚不成熟、整機(jī)規(guī)模不足、渠道和終端高度線(xiàn)下化,這些都決定了算法并不能單獨(dú)構(gòu)成拐點(diǎn)。
在這樣的前提下,高繼揚(yáng)更傾向于將具身智能的“ChatGPT時(shí)刻”理解為“在某些限定范圍內(nèi)具備商業(yè)價(jià)值的時(shí)刻”。他判斷,隨著整機(jī)、供應(yīng)鏈、數(shù)據(jù)和模型在過(guò)去兩年逐步補(bǔ)齊,2026年可能成為一個(gè)關(guān)鍵節(jié)點(diǎn)。
“2026年是形成‘應(yīng)用閉環(huán)’的一年。2025年上半年,我們明顯看到具身智能尚處于起步探索階段;2025年下半年,其發(fā)展速度迎來(lái)顯著提速。2026年有望成為具身智能技術(shù)的爆發(fā)之年,技術(shù)爆發(fā)將推動(dòng)部分應(yīng)用領(lǐng)域形成場(chǎng)景外溢效應(yīng),并與供應(yīng)鏈、整機(jī)產(chǎn)品形成協(xié)同聯(lián)動(dòng)?!备呃^揚(yáng)表示。
原力靈機(jī)聯(lián)合創(chuàng)始人兼CEO唐文斌則進(jìn)一步降低了這一時(shí)刻的門(mén)檻。在他看來(lái),姜大昕所定義的“ChatGPT時(shí)刻”更接近于實(shí)現(xiàn)AGI目標(biāo)(實(shí)現(xiàn)通用人工智能)。唐文斌更強(qiáng)調(diào),具身智能的“ChatGPT時(shí)刻”,核心是要在限定場(chǎng)景中完成閉環(huán)、算清ROI(投資回報(bào)比),并實(shí)現(xiàn)規(guī)?;涞貞?yīng)用。“ChatGPT給我們帶來(lái)最大的震撼是什么?我們?cè)?jīng)把它當(dāng)成一個(gè)玩具,但是在那一刻(即ChatGPT時(shí)刻),我們認(rèn)為它是一個(gè)工具,它變成一個(gè)可用的東西?!?/p>
在唐文斌看來(lái),當(dāng)機(jī)器人從玩具變成工具,這一刻便已經(jīng)具備了“ChatGPT時(shí)刻”的意義。
如果說(shuō)關(guān)于終極形態(tài)的判斷仍然分散,那么行業(yè)對(duì)“接下來(lái)該做什么”這一問(wèn)題則逐漸形成一條清晰的共識(shí)路徑:真機(jī)、評(píng)測(cè)與標(biāo)準(zhǔn)。
唐文斌坦言,當(dāng)前具身智能面臨的并非單點(diǎn)能力不足,而是整個(gè)技術(shù)架構(gòu)的缺失。“不管是數(shù)據(jù)還是硬件,我們今天在訓(xùn)練推理乃至整個(gè)鏈條上缺的東西非常多,評(píng)測(cè)也缺?!?/p>
在他看來(lái),如果無(wú)法評(píng)測(cè)真實(shí)能力,模型就無(wú)法真正進(jìn)化,現(xiàn)有的行業(yè)榜單規(guī)模有限。“(榜單上的)九十九點(diǎn)幾分能代表當(dāng)前真實(shí)的能力嗎?顯然不能,所以我們覺(jué)得非常需要來(lái)自物理世界、基于物理世界真實(shí)的、大規(guī)模的、真機(jī)的評(píng)測(cè),才能夠引導(dǎo)我們能夠更好向前?!?/span>
高繼揚(yáng)也提到,具身智能未來(lái)也會(huì)形成垂類(lèi)的概念,而垂類(lèi)一定是來(lái)自真實(shí)需求,將這些真實(shí)需求落到真機(jī)的測(cè)評(píng)中,才能給企業(yè)及需求方一個(gè)公允的迭代環(huán)境?!昂芏鄷r(shí)候AI還是實(shí)驗(yàn)科學(xué),它有一定的原理、數(shù)學(xué)做支撐,但最終很多事還是要試出來(lái),試這個(gè)東西就要有反饋,反饋就要有評(píng)測(cè)?!?/p>
汪玉則將這一評(píng)測(cè)體系與未來(lái)的開(kāi)放生態(tài)聯(lián)系起來(lái)。他認(rèn)為,高頻、可持續(xù)的真實(shí)世界評(píng)測(cè),比低頻的大型比賽更具推動(dòng)力,而這一體系最終應(yīng)當(dāng)以更公益、更開(kāi)放的方式存在,通過(guò)開(kāi)源框架、硬件、數(shù)據(jù)和評(píng)測(cè),形成對(duì)整個(gè)行業(yè)的基礎(chǔ)支撐。
在展望2026年時(shí),王仲遠(yuǎn)明確表示,相比模型能力的單點(diǎn)突破,他更期待在硬件、數(shù)據(jù)和模型輸出等層面形成統(tǒng)一標(biāo)準(zhǔn),從而降低驗(yàn)證和復(fù)現(xiàn)成本,推動(dòng)生態(tài)協(xié)同?!艾F(xiàn)在不管是硬件的標(biāo)準(zhǔn)、數(shù)據(jù)的標(biāo)準(zhǔn),包括模型輸出的標(biāo)準(zhǔn),整個(gè)生態(tài)非常碎片化?!?/p>
唐文斌則將目標(biāo)聚焦在“一個(gè)場(chǎng)景、一千臺(tái)、持續(xù)運(yùn)行”這一極具操作性的指標(biāo)上。在他看來(lái),規(guī)模化并非通過(guò)場(chǎng)景疊加實(shí)現(xiàn),而是在單一場(chǎng)景中跑通閉環(huán),這才意味著具身智能真正邁過(guò)產(chǎn)業(yè)化門(mén)檻。
封面圖片來(lái)源:可楊
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線(xiàn):4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP