今年全國兩會上,人工智能依然是代表委員們熱議的焦點。與過往更多關注大語言模型、通用人工智能等數字世界的突破不同,如何讓AI“走出屏幕”,在物理世界中完成復雜任務,正成為產業(yè)界和學界思考的下一個關鍵命題。
多位代表委員及業(yè)內專家關注AI在物理世界落地這一愿景的核心技術——具身智能產業(yè)的快速高質量發(fā)展。他們普遍認為,具身智能基礎模型,即機器人“大腦”是產業(yè)突破的關鍵戰(zhàn)場,需要多方聯合營造良好生態(tài),鼓勵企業(yè)自主創(chuàng)新。
“身體”強健“大腦”不足,產業(yè)瓶頸亟需突破
今年政府工作報告明確提出,培育壯大新興產業(yè)和未來產業(yè)。建立未來產業(yè)投入增長和風險分擔機制,培育發(fā)展未來能源、量子科技、具身智能、腦機接口、6G等未來產業(yè)。
這是“具身智能”連續(xù)第二次出現在政府工作報告中,標志著這一前沿技術已從技術研發(fā)階段正式邁入國家戰(zhàn)略層面的產業(yè)化培育期,成為新質生產力的關鍵組成部分。但截止到目前,許多具身智能機器人雖然能在春晚等舞臺,按照預先編好的程序完成精彩表演,卻未能大規(guī)模進入嚴肅的生產力場景。
對此,全國政協常委張連起在走訪調研了大量科技企業(yè)后了解到問題所在:“我國人形機器人之所以遲遲無法批量進入工廠和家庭,缺的不是‘身體’,而是能思考、會學習的‘大腦’。”,他指出,當前我國在具身智能應用場景、數據、硬件等多個維度已形成全球領先優(yōu)勢,但模型能力發(fā)展有所滯后,影響了行業(yè)高質量發(fā)展。
“‘大腦’是具身智能產業(yè)突破的關鍵戰(zhàn)場?!睆堖B起表示,當前產業(yè)界和公眾對具身智能存在一些認知誤區(qū),體現出“重硬件輕軟件、重集成輕研發(fā)”的傾向。例如,簡單地將“大語言模型”加上“動作模塊”就等同于具身智能?!斑@是大錯特錯。這種為數字世界設計的模型,難以應對物理世界的高度隨機性與不可預測性。真正能讓機器人在真實場景中操作長步驟復雜任務的,必須是物理世界原生驅動的具身基礎模型。”張連起表示。
確立自研戰(zhàn)略,聚焦原始創(chuàng)新“大腦”企業(yè)
針對如何突破具身智能技術瓶頸,張連起建議確立自主研發(fā)戰(zhàn)略,支持原始創(chuàng)新。全國人大代表、海爾集團董事局主席周云杰亦持類似觀點,他指出,我國具身智能正處于技術爆發(fā)與產業(yè)導入交叉期,呼吁設立國家重點研發(fā)專項,集中攻關核心算法,支持關鍵硬件研發(fā)與產業(yè)化,從源頭提升產業(yè)競爭力。
盡管我國具身智能基礎模型相對于硬件發(fā)展有所滯后,但也涌現出一批優(yōu)秀企業(yè)。張連起在調研了自變量機器人等聚焦“大腦”研發(fā)的代表性企業(yè)后表示:“近幾年,國內一批聚焦這一領域的公司陸續(xù)成立并取得了飛速發(fā)展。這類企業(yè)之所以值得關注,在于其成立之初就聚焦具身基礎模型自主研發(fā),并堅持以極具前瞻性的端到端統一架構來高效訓練迭代。”
據了解,自變量是國內最早聚焦端到端通用具身基礎模型研發(fā)的企業(yè)之一。在技術路線上,自變量選擇了更具挑戰(zhàn)但也更貼近物理世界本質的端到端統一架構進行正向研發(fā)。其自研的「WALL-A」模型,核心架構首創(chuàng)了視覺-語言-動作模型(VLA)與世界模型深度融合的系統范式。該模型采用原生多模態(tài)輸入輸出設計,率先實現“具身多模態(tài)思維鏈”,這一技術融合顯著提升了機器人應對未知情境的強大泛化能力,通過自主學習在物理世界中持續(xù)進化。
模型持續(xù)進化,正是驅動具身智能廣泛進入真實場景落地應用的關鍵。全國政協委員、科技部原副部長李萌指出:“具身智能作為與物理實體融合的人工智能,具備在與物理世界的互動中自主學習、持續(xù)學習的能力,正在成為改變人類生產生活方式、推動社會智能躍升的重要引擎?!彼硎?,無論從科學前景、技術前景、產業(yè)前景還是社會前景看,這方面技術突破都具有非常重要的意義和價值。
破解數據瓶頸,應由模型定義數據采集標準
數據是訓練強大“大腦”的關鍵“養(yǎng)料”。多位專家指出,當前行業(yè)普遍存在數據采集低效、“模型-數據”飛輪難以形成的問題。許多數據采集工作與模型研發(fā)的真實需求脫節(jié),導致大量資源浪費在無效或低質數據上。
解決之道在于確立‘模型定義數據’的采集機制,由真正開展模型研發(fā)的企業(yè)來定義所需數據的規(guī)格、質量與場景。例如中國信息通信研究院副院長魏亮就強調:應充分發(fā)揮具備具身智能基礎模型自研能力的行業(yè)領軍企業(yè)的引領作用,由其牽頭推進數據工廠數據集標準的研制與落地工作。唯有確立統一、規(guī)范的標準,才能從根本上優(yōu)化行業(yè)數據采集模式,實現采集成本的系統性下降與綜合運營效率的全面提升。
作為具身智能從業(yè)者,自變量創(chuàng)始人兼CEO王潛介紹,自變量機器人是國內最早規(guī)?;瘮U展真機數據采集的公司,堅持硬件-數據-模型的閉環(huán)迭代,通過基礎模型給數據處理和硬件設計等各個環(huán)節(jié)提供反饋,迭代更高質量的數據和更高效率的數采設備,進一步提升基礎模型的效果。
構建良好創(chuàng)新生態(tài),培育具身智能"熱帶雨林"
具身智能作為典型的前沿科技,其研發(fā)具有周期長、投入大、不確定性高的特點。多位代表委員指出,推動這一前沿產業(yè)發(fā)展,不能僅靠企業(yè)單點突破,更需構建一個能匹配其長周期特征的、包容而穩(wěn)健的創(chuàng)新生態(tài)系統。
全國政協常委、中國電子學會理事長徐曉蘭從產業(yè)格局視角進行了分析。她指出,具身智能將推動AI從“通用技術”向“場景化應用”升級,帶動算力、數據、算法突破。一個健康、自主的產業(yè)生態(tài)是實現這一目標的關鍵。徐曉蘭認為,具身智能產業(yè)將形成“3+3”發(fā)展格局:頂層是具備整機研發(fā)與生態(tài)能力的龍頭企業(yè),中層是專精特新企業(yè),底層是技術與基礎制造企業(yè);同時配套安全、維修、標準三大體系,為產業(yè)發(fā)展筑牢根基。
全國政協委員、廣州市科技局原局長王桂林倡導重塑“人才驅動、企業(yè)主導、活力涌現”的創(chuàng)新范式,推動科技創(chuàng)新與產業(yè)創(chuàng)新深度融合。他特別強調,應鼓勵更多經營主體與科研院所組建創(chuàng)新聯合體,探索更優(yōu)的融合發(fā)展模式。
堅實的生態(tài)離不開政策引導與適配的金融“活水”。張連起建議,應構建適配長周期創(chuàng)新的金融支持體系,并面向優(yōu)質具身智能企業(yè)開放工業(yè)、民生等真實場景,將政策支持與技術穩(wěn)定性、實際成效掛鉤。王桂林則強調,要把“投早、投小、投長期、投硬科技”落到實處,將政策重心從定向扶持轉向環(huán)境營造,通過強化風險兜底,營造更具多樣性和包容性的“熱帶雨林”式創(chuàng)新生態(tài)。