機察室|對話宇樹王興興:機器人“iPhone時刻”至少還要3年

藍鯨新聞8月21日訊(記者 張晗)乘着AI的風,具身智能成爲了今年資本市場最熱鬧的領域之一,那些曾經只會出現在科幻電影中的機器人正在離現實生活變得越來越近。

在2024年世界機器人大會正式召開之前,杭州宇樹科技(以下簡稱“宇樹”)發佈了其人形機器人G1的量產版本,起售價爲9.9萬元,這款產品將會在世界機器人大會上首次展出。視頻中的G1機器人身手敏捷,不僅可以空中劈腿,還可以自由地上下樓梯,輕巧敏捷。

從2023年8月做出H1到2024年5月發佈G1,宇樹不僅被投資圈關注,同樣也成了機器人企業中經常拿來對比的對象。這背後的原因在於,雖然人形機器人領域十分火熱,但真正賣得好的並不多,而宇樹H1和G1加在一起銷量可以達到幾百臺。更早之前,宇樹的機器狗還登上過央視春晚。產品出圈之後,宇樹創始人王興興也得到了更多人關注。

8月20日下午,王興興同包括藍鯨新聞在內的媒體交流溝通了人形機器人領域關注度比較高的話題以及宇樹未來的商業化方向等等。

儘管已經是人形機器人領域冉冉升起的新星,但年輕的王興興面對媒體和公衆的經驗還不太多,牛仔褲搭配印有宇樹logo標籤的白色T恤,拿起話筒做開篇介紹的時候,他的神態顯得有些侷促和緊張,但當問到與技術相關的問題時,他神采洋溢,耐心地解答着大家的疑問。

2020年之前,王興興很明確表示自己不會做人形機器人,因爲在大一寒假的時候他自己做過小的仿真人形機器人,但沒有達到預期,也沒有看到一些可以落地的實用價值。王興興態度的轉變發生在2022年,在特斯拉發佈第一代人形機器人Optimus之後,人形機器人的關注度立馬提升起來。同年ChatGPT的出現,使整個AI技術潮流發生了明顯的質變,行業也看到了AI賦能機器人帶來的潛力。“順勢而爲,要追着社會潮流去做,如果做得太早或太晚,其實都是不好的。”王興興說道。

相比於商業化落地場景等行業普遍關心的問題,王興興認爲現在人形機器人行業最大的難題在於,機器人AI的發展是落後於通用AI的,並未達到一個突破臨界點的時刻。現在更像是ChatGPT爆發之前的1—2年,距離人形機器人行業的“iPhone時刻”至少還有3—4年的時間,但應該不會超過5年。

王興興判斷,現在雖然行業比較熱,但說2024年就是人形機器人的商用元年,其實還太早,如果明年到後年可以形成商業閉環,也就是大規模地在工廠中應用起來,纔可以稱之爲商業化元年。

以下爲王興興同包括藍鯨新聞在內等媒體的對話交流,在保留原意的基礎上有所刪減調整:

Q:從目前人形機器人研發的角度看,大模型可重點解決哪些技術問題?主要應用在哪些方向?大模型和人工智能的應用有望降低研發成本嗎?

A:目前大家說大模型的時候,一般在說大語言模型或者多模態模型,肯定是可以給機器人用的,例如去年中旬我們就接了OpenAI的大語言模型接口,但機器人真正發展下去,單純的大語言模型還是不夠的。

機器人的AI模型,跟語言模型有很大的區別。大語言模型是機器人模型的一部分,但它不是全部。舉個最直觀的例子,在工廠裡做事的一個機器人,完全可以不說話。比如說我給它一個任務,看一張照片,或者敲一個數字進去,他只要能幹活就行了,我並不需要讓它說話。所以要做一個機器人的模型出來。比如把一些圖像數據,機器人的一些關節指令數據,還有一些激光雷達或者別的數據加在裡面,更重要一些。

但現實情況是,目前具身智能領域,每家企業的想法都不太一樣,技術路線上有所差別,甚至連一些共性的方面都不太一樣。例如機器人的相機應該裝什麼?裝幾個裝在哪?傳感器數據應該怎麼採集,是存在很多的差異性的,這就導致整個機器人AI模型的技術路線其實沒有那麼統一,其實很難評價哪個正確哪個錯誤,哪個路線已經推進到哪個節奏了等等。

就像在ChatGPT模型出來以前有非常多的語言模型架構,但大家現在已經忘了,因爲後來大家發現GPT模型的架構是更加有價值的,就把某些模型淘汰了。現在人形機器人有點像ChatGPT出來的前一兩年,大家已經發現了這個方向要往這個方向做,但實際上沒有哪家敢保證自己的方向是絕對正確的。

Q:宇樹G1 9.9萬元的起售價在市場上反映還是比較強烈的,爲什麼能夠這麼大幅度的降價?能不能具體分析一下在成本控制方面的一些做法?

A:我們一直希望有更合理的價格給客戶。因爲產品有人買,前提是價格相對比較友好,如果太貴了就買的人比較少。

我們價格目前比較有競爭力,原因也比較簡單,因爲我們做四足機器人已經做了很多年了,所以對於成本把控有一定的經驗,例如關節電機生產、整體機械結構、傳感器、如何使用更便宜的芯片等等。甚至可能大家想象不到,我們四足機器人和人形機器人,其實很多設計都是非常類似的。

所以在這樣的基礎上,我們目前像機器狗一臺最便宜賣到9000多塊錢人民幣。對比起來,我們的人形機器人還是有點貴的,因爲目前的量不夠,人形機器人行業整個體量還沒有完全起來,價格定得太低對我們公司也不是好事,對整個行業不是好事。如果明年後年整個出貨量更加提升,機器人的能力也會越來越強,我覺得價格還是可以有更好的調整。

Q:今年國內外很多人形機器人宣佈了進廠打工,目前您怎麼看這個現象?宇樹人形機器人的落地現狀和未來規劃是怎樣的?

A:這肯定是一個趨勢,埃隆·馬斯克最早提出要讓人形機器人去他的汽車工廠工作,所以整個行業對於汽車工廠是比較熱衷的。我們過去幾個月跟比如蔚來的汽車工廠有合作,就部署了我們人形機器人去做現場的搬運,包括國內的別的一些人形機器人公司也跟汽車工廠有些合作。

但這些基本上還是處於試點階段,大家覺得這個方向有價值,共同去推進這件事情部署落地,目前還沒有到真正商業閉環,當一臺機器人它產生的商業價值是正向的,就是可以做到比人的成本更低,現在還沒有到這個階段。

我們公司目前主要是賣本體比較多,某種程度上並不是說我們一定要做工業市場,比如做科研教育、AI公司或者個人買來玩等等,我們也完全歡迎。從未來發展來看的話,還是尊重整個市場的反應,而不是非要制定一個今年或者明年一定要在工廠裡要部署多少臺的目標。

Q:具身智能過去一年中和大語言模型一樣受到了市場的高度關注,您判斷通用機器人領域什麼時候會出現一個“iPhone時刻”?AI大模型爲機器人領域帶來了哪些明顯的能力的提升,目前還存在哪些挑戰?

A:“iPhone時刻”確實是一個非常重要的節點,但人形機器人行業距離這個時刻還有距離,因爲iPhone的出現並不是說有一個特別的技術突破,更多是綜合性的技術突破。比如原本已經有觸摸屏了,有很好的CPU,或者還有一些圖形界面已經有了,喬布斯把很好的終極產品的構想給提出來了,然後把這些技術都整合在一起。

目前在具身智能機器人AI這個領域,我個人還是比較樂觀,在今年年底之前,至少全球有一家公司或實驗室能把通用型的機器人AI模型給做出來。但是這個時間點,也不是“iPhone時刻”,“iPhone時刻”是指整個行業出貨量暴增的節點,至少還需要3—4年的時間,但不會超過5年。

Q:人形機器人它需要通過持續研發來取得技術上的創新,融資其實也是非常重要的,在資本進入後,會不會跟原有的研發團隊產生一些路線上的分歧,對公司的發展來講影響大不大?今年年初的時候,宇樹也拿到了包括美團在內的融資,未來會不會針對美團推出一些特定的機器人的服務的品類?

A:其實這個每家的情況都不一樣,我們目前的股東不會過多幹預我們產品研發的方向和節奏,美團確實現在是我們佔比最高的投資方股東,後續的話也大概率會跟他們有些合作之類的事情。

Q:在您看來目前人形機器人發展最大的瓶頸是什麼?

A:當下的所有機器人面臨最大的發展問題就是底層AI的能力在全球範圍內都沒有達到一個像初代GPT或者初代通用AI的能力。另外其實硬件方面的成本問題也有,比如機械臂的負載能力不夠,精度不太夠,但總體不難解決。

Q:目前有一些聲音認爲2024年是人形機器人商用元年,對此您怎麼看?現在機器人都還在投入期,您有沒有預估或者是預判什麼時候能到盈虧平衡?

A:今年的體量其實很小,就是在商業化的情況下,有些公司可能沒幾臺,最多也就小几十臺這種級別。我覺得把今年定義爲商用元年這個事情,有點不好評價,有人這麼說過,但我個人不喜歡這麼定義這件事情。

盈虧平衡其實是相對比較容易達到的,如果你大投入大量的AI與人力,可能很難盈虧平衡或者虧損會比較嚴重,但我們對AI的投入相對比較剋制,公司還是保留了合理的利潤率。