每日經濟新聞 2026-03-10 22:40:06
每經記者|張蕊 每經編輯文多
3月5日,政府工作報告出爐,“人工智能”被多次提及,同時,具身智能再次被寫入報告。
圍繞人工智能、具身智能領域的熱點話題,《每日經濟新聞》記者(以下簡稱NBD)在全國兩會期間專訪了全國政協(xié)常委、中國科學院院士、南京大學黨委書記譚鐵牛。
在采訪中,譚鐵牛感嘆,這幾年人工智能技術的進步超乎想象,“在預料之外”。他回憶道:“大概10年前,我們還把人跟機器人用自然語言交互作為一個重要奮斗目標,現在這個問題已經基本解決?!?/p>
但他也提醒:“這并不意味著現在人工智能是萬能的,它還有很多‘不能’——雖然不用人工智能又是萬萬不能的?!弊T鐵牛強調,發(fā)展人工智能要理性務實不跟風,因地制宜抓落地。
談產業(yè)成熟為時尚早
NBD:今年春晚舞臺上,機器人的表演再次成為全民話題。您認為這釋放出什么信號?這種集中曝光是不是產業(yè)成熟的標志?
譚鐵牛:人形機器人確實是當前科技革命和產業(yè)變革的熱點領域,大眾喜聞樂見。但我們要從中看出門道,不能光看熱鬧。
值得肯定的是,從去年的“秧Bot”到今年的“武Bot”(Bot是機器人的簡稱),宇樹人形機器人展現的水平令人印象深刻,1年之內從行走不穩(wěn)到翻跟斗,進步很快。這充分體現了我們自主創(chuàng)新的成就,證明中國人同樣可以引領世界科技創(chuàng)新的潮流。所以要堅定自主創(chuàng)新的信心,在這場人形機器人熱潮中,至少在運動、控制能力方面,我們已經走在世界前列。
但也要客觀看待。不能把人形機器人跟人工智能劃等號,看到翻跟斗等酷炫動作,便認為其具備了高度智能。這里必須厘清一個基本概念:人形機器人不等于人工智能。
機器人與智能是兩個高度關聯卻內涵不同的概念。機器人不一定有智能,它更多是承載人工智能能力的載體,具有一定智能的機器人才能叫智能機器人,人形機器人同樣如此。
現在全網熱議的人形機器人,更多體現了機器人控制和運動能力的進步,就像無人機編隊表演一樣,是在已知流程、已知動作、已知場景的情況下預編排、預訓練過的,不完全代表人工智能的進步。如果在表演過程中突然移動了道具位置,它可能就無法應對。如果它能自主尋找道具,那才是高難度,是真正的人工智能體現。
所以現在談產業(yè)成熟還為時尚早。我認為,人形機器人如果一直只是跳跳舞、翻翻跟斗,終究會是曇花一現,一定要找到“殺手級”的應用。春晚之后機器人訂購量很多,這不奇怪,但新鮮感、好奇心不會持續(xù)。關鍵在于,它是不是剛需、能解決什么問題。如果找不到“殺手級”應用,終會被歷史所淘汰。
這里有一個歷史教訓。日本是人形機器人研究起步較早的國家,在2000年就推出了轟動全球的人形機器人“阿西莫”,但在面世22年后,因成本高昂且實用性有限,未能找到“殺手級”應用,最終退出歷史舞臺。
當然,宇樹機器人在運動控制能力方面已遠超當年的“阿西莫”,不過,其智能水平仍然有限。
機器人要具備強大的場景感知能力
NBD:您覺得這種“殺手級”應用會出現在什么領域?
譚鐵牛:太多了,比如制造,比如巡檢——巡檢道路、高鐵、高壓電線。但巡檢工作的要求比較高,需要機器人具備“火眼金睛”,也就是視覺能力要強、運算速度要快,這就不僅僅需要控制和運動能力,還要有對環(huán)境的感知能力、理解能力。在巡檢領域,現在有一些落地應用,但在開放場景中仍有挑戰(zhàn)。
NBD:當前機器人技術距離真正進入家庭、工廠等真實場景,還有哪些關鍵障礙需要跨越?具有很高智能水平的機器人什么時候會走進千家萬戶?
譚鐵牛:機器人已經走進千家萬戶,比如常見的掃地機器人,就具有一定智能能力。但智能人形機器人要真正進入家庭,要能幫助人干更多家務,實現無縫的人機協(xié)同,還有很多難關。在我看來,至少需要5年以上。
原因在于,機器人需要具備強大的場景感知能力。它要知道周圍環(huán)境是什么、自己在哪里,還要知道人的意圖是什么、想干什么。不能老是擋路,也不能在別人要拿走杯子時卻開始倒開水。要根據人的行為判斷其意圖,難度很大。如果不知道對方要干什么,就無法實現協(xié)同,甚至因為誤操作帶來風險。
另一個關鍵短板是末端靈巧操作,尤其是“手”的靈巧性。目前的觸覺傳感能力還遠遠不夠,無法精準感知物體的光滑度、材質、溫度、濕度等。人形機器人什么時候能做到隨時上場跟人對打乒乓球并能取勝,那時我才真正佩服,而目前還差得很遠。
NBD:業(yè)界比較樂觀,覺得3~5年就能實現智能機器人走進千家萬戶。您認為這種樂觀是不是有資本過熱的因素?
譚鐵牛:有人認為(產業(yè))有泡沫,我贊同。我認為主要有三重泡沫:
首先是期望值泡沫。大家對人工智能和人形機器人期望值很高,這幾年的進步也確實超乎想象,但并不意味著現在人工智能是萬能的。因為發(fā)展很快,就認為幾年之內通用人工智能(AGI)就能實現,這過于樂觀。
其次是投資泡沫。OpenAI已燒掉巨額資金,至今尚未盈利。
最后是估值泡沫。OpenAI雖未盈利,估值卻高達數千億美元,明顯過高。一些人工智能公司,一個像樣的產品還沒有就被估值十幾億元、幾十億元,這明顯是虛高。此外,一些媒體和自媒體的炒作也放大了泡沫。
諾貝爾經濟學獎和圖靈獎得主司馬賀在1965年人工智能第一次浪潮時曾預測,20年內機器能做人所能做的一切工作。但這一預測至今未能實現??梢?,熱潮之中更需要理性。
實現通用人工智能任重道遠
NBD:您曾說“馬斯克們過于樂觀了”,并認為通用人工智能還遙不可及。但業(yè)界對AGI的追逐熱度不減。在“理性務實”與“技術理想主義”之間,您認為中國的人工智能發(fā)展應該如何把握節(jié)奏?
譚鐵牛:關鍵在于如何定義通用人工智能。我的定義是,能夠媲美和超越人類智能(智慧)的人工智能,才是通用人工智能。它至少要跟人類差不多,能做人所能做的一切事情。如果是這樣定義,我認為至少在看得見的未來很難實現。
原因在于,人有頓悟、常識,會舉一反三、融會貫通,更重要的是能聽出話外音,能讀出字里行間的言外之意。而目前的人工智能有時連常識都搞不清楚,因為它是靠大數據訓練出來的,并未真正把握物質世界的因果關系和物理規(guī)律。
“智能”目前沒有統(tǒng)一的定義,人的智能和智慧的機理也沒完全搞清楚。超越一個尚未完全理解的事物,在邏輯上是說不通的。只能說表面上超越有可能,但表象無法窮盡所有方面,無法進行完備性測試。從表象上看,現在還存在認為人工智能已經具有意識和情感的誤解,實際上它只是表現得像有情感、有意識,那是模仿。模仿不等于具有,不等于掌握。
對通用人工智能,我始終有兩個疑問。
第一,在實際應用中是否需要通用人工智能?通俗來說,“通用”就是什么都能干。這點在我個人看來,答案是否定的,因為術業(yè)有專攻。我們說要培養(yǎng)復合型人才,但并不意味著這個人什么都能干好,沒有所謂的通才。
既然如此,為什么不搞一批精深的專用智能體?讓他們各自分工,協(xié)同調度。即便在家庭場景中,做飯、打掃、照顧老人都是同一個智能體,它也只能算多用,而不能叫通用。
第二,通用人工智能能否實現?通用人工智能要超越人類智能,而人的智能機理尚未完全搞清楚,如何超越?因此,對通用人工智能,我的觀點是,依然任重道遠或者說遙不可及。
具身智能是逼近人類智能的必由之路
NBD:現在有一種觀點認為,具身智能是實現通用人工智能的一個必經階段。您怎么看?
譚鐵牛:當然,如果是要無限逼近人的智能和智慧,具身智能是一個路徑,或者說必由之路。不過,當前“具身智能”一詞也存在被濫用和標簽化的現象。
具身智能有兩個核心要素:一是擁有身體,即看得見摸得著的物理本體;二是與環(huán)境持續(xù)交互,在“摸爬滾打”中變得越來越聰明。如果跟環(huán)境交互只是執(zhí)行既定任務,那不能叫具身智能。
當前存在一些理解偏差,以為只要有實體、有一點智能,就是具身智能機器人。這是錯誤的。要區(qū)分機器人與人工智能、機器人與智能機器人、智能機器人與具身智能機器人之間的區(qū)別。
簡單來說,機器人是硬件實體,智能機器人是在此基礎上加載了智能能力。例如,普通的工業(yè)機械手是預編程的,沒有智能;而智能機械手在拿東西時,若遇到障礙物,能自主改變路徑,繞過去繼續(xù)執(zhí)行任務。
那么,具身智能機器人與智能機器人的區(qū)別何在?首先,機器人如果是實體的,肯定是具身的。其中具身智能機器人必須在與環(huán)境交互的過程中變得越來越聰明,通過學習不斷提升智能,掌握原本未被預設的能力。
因此,為何說具身智能是逼近人類智能的必由之路?因為人類智能正是這樣進化而來的。要逼近人類智能,最直觀也可能是最有效的路徑,就是跟人一樣去學習和進化,才有可能實現超越。
這幾年我對具身智能的認識確實有一個轉變過程,剛開始對具身智能有疑慮。因為人類和動物的自然智能,本就是在摸爬滾打中慢慢成長起來的,要經風雨、見世面才能長才干。這不正是具身智能的基本內涵嗎?你看“智”字,上面是“知”,下面是“日”,代表日復一日的親身經歷。智慧、智力、智能就意味著經風雨、見世面,親身經歷和實踐。
因此,具身智能最核心的一點就是在與外部交互的過程中得到動態(tài)提升。
大模型不可能不停的“大”下去
NBD:您反復提到智能,這個智能是不是可以理解為大模型的能力?您怎么看大模型在具身智能中扮演的角色?現在是否存在“過度依賴大模型”的風險?
譚鐵牛:這里面又有幾個概念需要厘清。大模型不等于人工智能,具身智能是發(fā)展人工智能的一個途徑、一種方法。
大模型則是當前這波人工智能熱潮的核心技術,其基礎是深度神經網絡,通過模擬人腦分層處理信息的機理,由粗到細、由粗到精地學習。所謂大模型,可粗略理解為一個巨大的、擁有海量參數的“人工”神經網絡(模仿人類腦神經網絡),通過大量數據訓練而成。它只是實現人工智能的一種方式,而非全部。模擬人的智能,不一定非要通過模擬人的神經網絡實現,這確實是最直觀的方式。
我曾在去年4月提出一個觀點,目前正逐步得到驗證:完全依靠堆算力、堆數據來發(fā)展人工智能的路子是不可持續(xù)的。原因有三:一是性能提升不可持續(xù),投入同樣的數據和算力,性能提升越來越小;二是算力不可持續(xù);三是數據不可持續(xù)。互聯網上的可用數據幾乎被用盡。任何物理系統(tǒng)都有其極限,必須另辟蹊徑。
DeepSeek(深度求索)之所以引起轟動,就是因為沒有完全依賴算力和數據,而是通過算法創(chuàng)新,用更少的芯片和數據達到了同樣甚至更好的效果。
大模型不可能不停的“大”下去,規(guī)模效益總有極限。所以一定要另辟蹊徑,具身智能就是一條路徑,它不完全依賴于互聯網上的現成數據,而是在與環(huán)境的交互過程中動態(tài)獲取數據,例如在拿杯子的過程中感知材質、光滑度等。
未來3~5年可關注腦機接口等領域突破
NBD:未來3~5年,人工智能和具身智能領域最值得關注的顛覆性突破是什么?
譚鐵牛:我認為有幾個方向值得關注。
首先是在底層結構和新的機器學習模式上取得突破。完全依賴數據的路徑不可持續(xù),需要探索數據與規(guī)則相結合的新模式。將數據驅動與規(guī)則結合,用規(guī)則處理確定性部分,用數據解決不確定性部分。同時,探索數據與知識相結合的新模式,實現數據和知識的雙輪驅動。這是未來3~5年值得關注的技術突破。
其次是傳感技術的突破,特別是高靈敏度、多功能的傳感技術。這直接關系到靈巧手等末端執(zhí)行器的能力,對具身智能至關重要。
另外,還需要新的機器學習方法,新方法應該追求低成本、高效率,減少對算力和數據的蠻力依賴。借助腦科學、認知科學機理的新智能方法有可能取得突破,從而孕育出新模式,開辟不依賴大模型的發(fā)展路徑。
此外,智能體以及多智能體協(xié)作非常重要,值得關注。人機協(xié)同也很重要,事關人與機器如何協(xié)作、如何交互的腦機接口技術也可能會有突破。
要避免稟賦條件差異導致的“人工智能鴻溝”
NBD:您對當前社會上關于“人工智能將取代人類”的普遍焦慮,特別是具身智能可能取代藍領工作的擔憂,有什么建議?我們關注到,南京大學正在推進“1+X+ Y”人工智能通識教育,這種通識教育是否能滿足AI(人工智能)時代的人才需求?
譚鐵牛:人工智能取代部分工作崗位是必然的,這是技術進步的常態(tài)。但總體而言,它不是要把人類的飯碗全部砸掉。
世界經濟論壇《2025年未來就業(yè)報告》預測,2025年~2030年,全球將有9200萬個工作崗位被替代,同時預計催生1.7億個新崗位。
但新增的崗位,并不一定能讓那些被替代的人來干。如果人們不堅持終身學習,不重視崗位再培訓,就可能面臨失業(yè)。反之,如果超前謀劃,加強在崗培訓,創(chuàng)新課程設置和培養(yǎng)模式,就能讓勞動者適應新的崗位需求。
因此,南京大學在人才培養(yǎng)中提出“三個適配”:一是適配國家需求,要根據國家需求調整專業(yè)設置。二是適配時代特點,這個時代最重要的特點是智能化。2024年,我們在全國率先開設人工智能通識必修課,覆蓋所有專業(yè)學生,并培訓教師,因為人工智能會淘汰不用人工智能的人。三是適配學生發(fā)展,做到因材施教。
這是我們教育教學改革的底層邏輯,不是為了搞噱頭。
NBD:對于人工智能的發(fā)展,您還有哪些建議或思考?
譚鐵牛:我認為還有幾點需要重視。首先要特別注意人工智能賦能的區(qū)域性問題、行業(yè)性問題,避免因人工智能稟賦條件的差異導致“人工智能鴻溝”,從而加劇區(qū)域、行業(yè)發(fā)展不平衡,激化社會主要矛盾。
同時,擴大內需是拉動經濟的首要任務,應大力推動AI賦能消費,創(chuàng)造新的消費場景,比如家政、養(yǎng)老、教育等領域。具體來說,陪護機器人如果真的做到善解人意、安全可靠、價格合適,就是潛在的“殺手級”應用。當然,這里還涉及諸多待解問題,包括標準、倫理、安全性等,這些都需要在發(fā)展中逐步解決。
封面圖片來源:新華社
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP