翻車,纔是斯坦福炒菜機器人學習人類的常態
機器之心報道
作者:大盤雞、陳萍
電視劇中角色的驚豔亮相不一定能打動你的心,但斯坦福全職管家兼御用大廚一定能拿下你對機器人的期待。
你還記得斯坦福 Mobile ALOHA 的神操作嗎?備菜、翻炒、出鍋,洗衣、逗貓、澆花它是樣樣精通。不過它也並非一直如此優秀。人有失足,馬有失蹄,ALOHA 也有翻車時刻。我們一起品鑑一下 ALOHA 的「報錯」操作。
原本是爲了擦酒杯下的酒漬,或許是怕觀衆老爺看不出,只能多灑出來一點來引起注意。
每個物品都是獨立的個體,鍋、油、蝦、碟都將有屬於自己的歸宿。
抓走物品旁邊的空氣,四捨五入也算是抓走了物品。
別人炒菜用時五分鐘,機器人大廚先用一分鐘炒一炒鍋。
看到這樣的行動表現,打破了我們對 Mobile ALOHA 的美好期待,坐等機器人爲我們養老只能是「陽光下的泡沫,一觸就破」。
實際上,在最初兩個 Mobile ALOHA 火爆的視頻中,不少讀者對於它的行爲方式就有些錯誤的認知。比如在幫男生刮鬍子這項任務中,可能大家都誤以爲這是機器人自主完成的,然而事實並非如此,這是通過人類遠程控制完成的:
來自英偉達的研究科學家 Jim Fan 對此發佈了推文,提醒大家別因爲視頻的驚豔程度就忽略了其中技術真相。他提到,應該將 Mobile ALOHA 看作是一輛製造精良的跑車,而它仍需要人類駕駛才能表現出自己的能力。現在的水平與能夠完全自主的廚師還有較大的差距。
其實,研究團隊在發佈 Demo 時的項目頁面中就對 Mobile ALOHA 的工作進行了明確分類。其中包括 Mobile ALOHA 能夠自主完成的任務以及需要遠程操作完成的任務。
研究團隊在介紹時表示,對於一些簡單的任務,Mobile ALOHA 可以在 50 次學習之後達到 90% 的行動成功率。對於一些簡單的任務,如炒一隻蝦仁(有且只有一隻)、拿塊抹布、擺放好椅子,Mobile ALOHA 無需人類指點,還是可以自己 hold 住的。
Mobile ALOHA 可以自己完成的任務
不過,更加複雜的任務,如像炒蝦仁滑蛋、打蛋、裝盤等複雜操作,它依舊需要人類遠程操控,而且有些視頻還做了 10 倍加速處理。
依舊需要遠程操控才能完成的任務
在機器人技術領域,從人類示範中進行的模仿學習已經取得了令人矚目的成績。其實訓練 Mobile ALOHA 的過程就是像是在玩遊戲 —— 操作機器人直到動作通關。Mobile ALOHA 之所以能夠讓人發出驚歎,是因爲它所展示的任務不侷限於桌面操作。這些複雜且靈活的動作源於研究者開發的一套系統,用於模仿需要全身控制的雙臂移動操作任務。利用 Mobile ALOHA 收集的數據,進行有監督的行爲克隆。
在上一篇文章中,我們已經分享了 Mobile ALOHA 具體的技術細節,但是並不直觀。
圖(左)展示了操作機器人最簡單的方法就是將操作員的腰部與移動底座系在一起的。
加州大學聖地亞哥分校學生樑力天在 X 上發佈了 Mobile ALOHA 的體驗視頻,他操縱 ALOHA 拿取箱子上的物品。簡單來講,如果你現在擁有了 Mobile ALOHA,最重要的一步就是需要你與 Mobile ALOHA「合二爲一」。
雖然樑力天沒有體驗炒蝦這樣的高難度任務,但是依舊對 Mobile ALOHA 的技術表示了認可:它的直接關節映射使用起來非常直觀,這使它成爲比 VR 控制器更好的解決方案。這樣的能力,只要 3.2 萬美元的預算真的太值了。
圖源:https://twitter.com/litian_liang/status/1744555501860638921
https://twitter.com/DrJimFan/status/1744786506810900679
在這個體驗視頻發出後,大家都很好奇,遠程操控的原理到底是什麼?Jim Fan 是這樣解釋的:
訓練機器人就像在真實世界中玩遊戲,一個人操作一個操縱桿來執行任務和收集數據,在遇到安全問題時進行及時的干預。
遠程操控可以通過不同的方式完成,這裡有一些其他選擇:
最後,Jim Fan 說道,「我相信,只要有好的硬件,到 2024 年底,我們就能大幅提升自主技能。」
https://twitter.com/DrJimFan/status/1744786506810900679
https://twitter.com/tonyzzhao/status/1743378437174366715
https://mobile-aloha.github.io/resources/mobile-aloha.pdf
https://mobile-aloha.github.io/
https://twitter.com/litian_liang/status/1744555501860638921