具身智能奇點將至,人形機器人哪些要點值得關注丨調研筆記
人形機器人作爲具身智能的優質載體,受益於AI(人工智能)技術的快速突破,擁有感知、思考、決策等能力不再遙不可及。這也加速了人形機器人逐步走向產業化階段。
2024年世界機器人大會以“共育新質生產力,共享智能新未來”爲主題,於8月底在北京開幕。本屆大會共有27款人形機器人整機亮相,數量創歷屆之最。這些新品不僅在外觀上更加接近人類,而且在功能上也實現了重大突破。
2024年被認爲是人形機器人產業化“元年”,人形機器人已經從早期的簡單模型發展到如今具有高度集成和智能化的階段。未來,人形機器人將憑藉其性能優勢在工業、生活等各領域高速滲透,潛在市場空間達上百億美元。
根據Stratistics Market Research Consulting數據,預計2022-2030年全球人形機器人市場CAGR有望達到63%,其中國市場規模從2022年的2.5億美元增長至2030年的105億美元,CAGR爲59.4%。
第一財經深度調研此次參會人形機器人本體廠商和核心零部件公司,進一步瞭解人形機器人的產業化進程和行業投資機會。
1、多場景落地應用,小規模量產在即
人形機器人產業正在從概念走向實用化,多場景落地應用正逐步成爲現實。人形機器人的產業投資也從關注概念走向關注企業量產情況。除了B端商業及工業場景的應用,C端人形陪伴服務機器人也逐漸走向現實。
在B端尤其是工業場景的應用,特斯拉、優必選等企業的人形機器人在大模型技術的加持下已經實現在智能生產線的應用落地;而C端場景的應用上,由於家務場景多達一千多項任務,目前家庭服務人形機器人能夠實現的任務尚不足十分之一,走進千家萬戶仍需要時間。但家庭陪伴人形機器人有望在年內落地。優必選此前就預計,在2024年年底、2025年年初,會推出一款家庭陪伴功能的人形機器人。
需要注意的是,投資人在關注各大廠商小規模量產情況的同時,需格外注意各大廠商交付後在實際應用場景的性能情況。某頭部機器人廠商表示,大規模量產在技術上並沒有太大難度,主要難度是下游對產品的需求度,而這取決於目前小規模試點應用的情況。
2、“大腦+小腦”,大模型實現具身智能
2024年,人形機器人行業在具身智能領域取得了顯著的突破,基於通用大模型、數據集、高效計算架構、多模態融合感知等關鍵技術,爲人形機器人安上聰明的“大腦”,使得人形機器人具備認知和決策能力,推動人形機器人走向實用階段。
國內人形機器人廠商主要採用分層端到端的方案,即通過“大腦大模型”和“小腦大模型”互相配合完成任務。“大腦大模型”大多基於多模態通用大模型,完成對任務的感知規劃,再通過API調度“小腦大模型”驅動關節硬件完成執行。
例如優必選人形機器人Walker S接入百度文心大模型;智元機器人與科大訊飛簽署合作戰略協議,依託訊飛星火大模型進行聯合開發;樂聚機器人夸父搭載的是華爲盤古大模型。
在“小腦大模型”方面:
值得注意的是,特斯拉Optimus使用完全端到端的神經網絡大模型,藉助傳感器和計算機視覺技術,利用海量數據不斷優化訓練過程,直接生成關節控制序列。按照智元機器人此前定義的G1至G5的具身智能技術演進路線,特斯拉目前進入G4階段,國內大多人形機器人廠商目前仍在G3階段。
在“小腦”操作大模型領域,各大廠商剛剛起步,多技術路徑同步發展。操作大模型決定了人形機器人在任務執行側的準確度,是大規模商業應用場景落地的前提,需關注各大廠商“小腦大模型”技術進展及落地應用情況。
3、具身智能訓練數據仍較爲短缺
由於訓練機器人所需的物理數據不如文本數據量大且易獲得,相較於圖文大模型千億規模的數據訓練量,目前機器人數據集量遠不能滿足機器人達到通用大模型的需求。目前解決人形機器人訓練數據短缺的問題,一方面通過強化學習算法提高模型訓練效率,一方面則通過仿真平臺合成數據,建立數據開放生態。
銀河通用自研合成了千萬級的場景數據以及十億級的抓取數據,在合成數據的訓練下,其蓋博特人形機器人目前已實現抓取隨機放置的透明、高光等物體成功率在95%以上,進一步掌握類似開櫃子、開抽屜、晾衣服等靈巧手泛化操作技能。
智元機器人構建了一套完整、全流程的數據採集、應用的方案AIDEA,包含AIDEA ML機器學習平臺和AIDEA Sim仿真平臺。預計智元會有百臺以上自由部署機器人專門用來做端到端的數據採集,也將於四季度開源基於AIDEA的百萬條真機、千萬條仿真數據集,以積極建設開放生態。
各地人形機器人創新中心也在積極建設人形機器人訓練場。上海人形機器人制造業創新中心孵化的“開源道場“MiniGym”,2024 年計劃上海打造100個人形訓練場,2027 年計劃在各個城市、各個場景打造 1000 個訓練場,100臺採集設備,構建 1PB 數據集(每週生產 5TB+)。北京創新中心自主研發的通用人形機器人母平臺“天工”的訓練基本都是在虛擬的世界完成的。
數據對於訓練人形機器人具有至關重要的作用,它直接影響到機器人的感知能力、思考和決策能力以及行動執行能力。大模型通過大量數據學習,讓機器人理解任務意圖,並遷移到下游任務中,高質量訓練數據能夠有效提升人形機器人場景泛化能力。除了關注各大廠商訓練數據獲取方式,同時也可以關注與各大人形機器人創新中心合作生態共建情況。
4、觸覺感知是人形機器人精準控制的關鍵
人形機器人的視覺和聽覺在深度學習算法以及人工智能的支持,已經發展較爲完善,但在觸覺方向上的技術進展要落後於視覺及聽覺,觸覺傳感器爲人形機器人提供了與環境進行物理交互的能力,是實現高級機器人功能和應用的關鍵技術之一。
觸覺傳感器使機器人能夠通過接觸來感知周圍環境,從而實現更精細和複雜的交互。同時藉助觸覺傳感器,人形機器人能夠進行精確的操作,如抓取易碎或形狀不規則的物體,實現平穩且準確的握持,同時可以幫助機器人感知施加在物體上的力,這對於手術或精密裝配等需要精確控制力度的場景中至關重要。
由於觸覺涉及物理量過多難以解耦,觸覺傳感器研發難度大、精度提升困難,成爲人形機器人急需突破的關鍵技術之一。
觸覺傳感器企業帕西尼感知科技稱,該公司的核心產品已應用於國內外頭部機器人企業,且在多維觸覺傳感器領域保持出貨量、市佔率領先。該公司在今年世界機器人大會上展示了其標杆性的第二代多維觸覺人形機器人TORA-ONE,還推出了第二代多維觸覺靈巧手DexH13以及多維度觸覺傳感器PX-6AX GEN2。
作爲人形機器人精準控制的關鍵,觸覺感知的相關發展與應用將進一步推動人形機器人商業化走深走實。目前國內柔性觸覺傳感器仍處於產業化早期階段,受益於人形機器人的需求驅動,有望加速國產廠商技術更迭和市場空間提升。