在2024世界機器人博覽會現(xiàn)場,人形機器人“天工”一出場就吸引了眾多觀眾圍觀,儼然是博覽會上最亮眼的明星。作為具身智能應(yīng)用到機器人上的代表,“天工”的亮相也讓大家對于具身智能賦予機器人的能力有了具象化的了解。
具身智能可以理解為“具身+智能”,通過賦予AI“身體”,能夠與現(xiàn)實產(chǎn)生交互,讓AI從僅存于數(shù)字世界的軟件算法走向真實的物理世界,在物理世界也能呈現(xiàn)模擬人類甚至超越人類的智能水平。具身智能強調(diào)不僅通過算法和計算實現(xiàn)智能,還通過具身本體與物理世界的交互來展現(xiàn)和發(fā)展智能。
具身智能發(fā)展至今經(jīng)歷了三個階段,即早期萌芽階段、技術(shù)積累階段和技術(shù)突破階段。2022年至今,以ChatGPT為代表的大模型的通用知識和智能涌現(xiàn)能力為機器人實現(xiàn)智能感知、自主決策乃至擬人化交互方面帶來巨大潛力。
當前人們的關(guān)注點轉(zhuǎn)向如何將AI應(yīng)用于物理世界,并期望通過AI的“具身化”找到新的智能增長點。“具身智能是長了身體的智能,是技術(shù)上一個非常巨大的進步。”北京具身智能機器人創(chuàng)新中心總經(jīng)理熊友軍說,“我們認為具身智能是人工智能的一個新范式,它具有可以跟物理世界直接進行交互、能夠自主學習的特點。這種自主的學習實際上可以更加主動和積極,也更加具有創(chuàng)造性。”
中國信通院發(fā)布的《具身智能發(fā)展報告(2024年)》顯示,目前,具身智能技術(shù)尚處于多條路徑探索發(fā)展階段,并且在感知與認知、學習與泛化、計算能力、多任務(wù)處理、安全性、隱私保護以及人機關(guān)系等多個方面都面臨挑戰(zhàn)。
在算法層面,具身智能系統(tǒng)在實現(xiàn)通用智能時面臨兩大根本性挑戰(zhàn)。一是系統(tǒng)需要人類智能的介入;二是尚未實現(xiàn)感知到行動間的認知映射。在數(shù)據(jù)層面,缺乏數(shù)據(jù)成為具身智能能力突破的重要壁壘。一方面,真實數(shù)據(jù)面臨獲取成本過高、廣泛、高質(zhì)量和多樣化的挑戰(zhàn)。另一方面,仿真合成數(shù)據(jù)面臨“現(xiàn)實差距”,即模擬環(huán)境與現(xiàn)實世界之間的差異挑戰(zhàn)。在軟件層面,缺乏統(tǒng)一的操作系統(tǒng)和標準化軟件開發(fā)工具鏈。在硬件層面,耐用性和能源效率以及與軟件的深度集成需求構(gòu)成了具身智能硬件發(fā)展的主要障礙。在標準與合規(guī)層面,具身智能技術(shù)、評測、安全倫理等標準缺失,面臨信息安全、個人隱私等一系列倫理和社會學問題。
報告顯示,具身智能將在技術(shù)涌現(xiàn)式創(chuàng)新和突破下,實現(xiàn)“一腦多形”“一機多用”,其相關(guān)應(yīng)用有望快速擴展至社會經(jīng)濟的各個層面,推動生產(chǎn)力的躍升和生活方式的變革。未來具身智能將從工業(yè)協(xié)作生產(chǎn)到柔性制造,從家務(wù)助手到醫(yī)療護理,從災(zāi)難救援到太空探索,深度融入人類社會。可以預見的是,具身智能有望帶來更高的應(yīng)用價值和更廣闊的市場空間。在工業(yè)制造領(lǐng)域,具身智能可以打破人機協(xié)作瓶頸,實現(xiàn)智能化柔性適配;在自動駕駛領(lǐng)域,具身智能可以適應(yīng)開放環(huán)境,實現(xiàn)安全可靠駕駛;在家庭服務(wù)領(lǐng)域,具身智能可以解放人類雙手,實現(xiàn)全場景智能家務(wù)服務(wù);在醫(yī)療康養(yǎng)領(lǐng)域,針對老齡化問題,具身智能可以實現(xiàn)擬人交互服務(wù)等。