☰

對話宇樹科技創始人王興興：人形機器人大模型，還沒走到“大力出奇跡”階段

隨着人形機器人逐漸成爲創投領域的熱門賽道，宇樹科技也越來越多地受到市場關注。

這家成立於2016年的公司，起步階段是專注於四足機器人的開發。2023年初，宇樹科技立項人形機器人產品，並在同年推出了首款通用人形機器人產品宇樹H1。2024年2月，宇樹科技完成了近10億元B2輪融資，美團成爲該公司的最大股東。

8月21日，世界機器人大會期間，宇樹科技發佈了人形機器人G1的量產版本，起售價爲9.9萬元，這是雙足人形機器人價格首次下調至10萬元以內。宇樹科技方面稱，G1人形機器人，身高約127釐米，體重約35公斤，小跑速度超過2m/s ，擁有23至43個關節，可執行如動態站起、坐下摺疊、舞棍等動作。

“宇樹科技入局人形機器人賽道，基本上是遵循順勢而爲的邏輯。如果做的太早或太晚，其實都是不好的。”

宇樹科技創始人王興興表示，大語言模型出來以後，AI的技術產生了質變，大家已經看到AI賦能機器人帶來的潛力。對於人形機器人而言，基本就是四足機器人站起來的另一個版本。

王興興認爲，在過去的一到兩年內，國內很多人形機器人公司之所以可以跑出來，是因爲大家用了大量開源的四足機器人技術，包括控制算法、硬件等。但是，人形機器人想要繼續發展，單純靠大語言模型還遠遠不夠。大語言模型本身是機器人模型的一部分，但它不是全部。

從ChatGPT的技術邏輯也可以看到，大語言模型找尋到了一條“大力出奇跡”的可行性路徑。OpenAI通過不斷地增加算力和數據，ChatGPT的人機交互能力就可以不斷上升，而且目前業界還沒有看到這種能力提升的“天花板”。但對於機器人大模型而言，王興興認爲目前這個行業沒有走到“大力出奇跡”的階段。

“目前國內的大公司其實對AI和機器人都挺關注的，但他們的投入也是比較剋制的。”

王興興對鈦媒體APP表示，大公司和創業公司對於機器人大模型投入比較剋制的最大原因就是，機器人模型的技術路線沒有像大語言模型那麼清晰。“在這模型研發沒有清晰路線的階段，如果投入大的財力和人力，其實會有點使不上勁的感覺。這條路你都不太清楚，你拼命往裡面跑也跑不了。”

王興興稱，在人形機器人領域，通過增加算力和數據可以提升機器人某一方面的能力。機器人通用的AI模型，全球範圍內大家做得都不夠好，目前沒有人可以真正將AI機器人做到極致。“全球都沒有人做出來的情況下，你可以認爲這件事情需要靠運氣，或者看某個天才式的人物來推動了。”

以下是王興興與包括鈦媒體APP在內的交流內容，略經編輯：

從目前人形機器人研發的角度看，大模型可解決哪些技術問題？主要應用在哪些方向？大模型和人工智能的應用有望降低研發成本嗎？

王興興：大家說大模型的時候，一般是在說大語言模型或者多模態模型，這部分肯定是可以給機器人用的。但真正的機器人大模型發展下去，單純的大語言模型還是不夠的。大語言模型本身是機器人模型的一部分，但它不是全部。

舉個最直觀的例子，比如在工廠裡做事的一個機器人，他完全可以不說話，他只要能幹活就行了。而對於幹活這個點的話，這部分的訓練其實跟大語言模型沒多大關係，更多的是一些模仿學習。而且這個模型結構跟大語言模型結構也會偏差比較大，目前整個體系沒有那麼成熟，不像大語言模型整個的風格結構、數據對齊那樣清晰的。

在ChatGPT模型出來以前有非常多的語言模型結構，但大家現在已經忘了，因爲後來大家發現GPT模型的架構是更加有價值的，就把其他模型淘汰了。現在人形機器人具身智能有點像ChatGPT出來前的一兩年，大家已經發現了要往這個方向做，但實際上沒有哪家敢保票，說我這個方向是絕對正確的。

今年國內很多外人形機器人公司都宣佈“進廠打工”，您怎麼看這個現象？宇樹科技的人形機器人的落地現狀和未來規劃是怎樣的？

王興興：這是一個趨勢。我們過去幾個月也跟蔚來的汽車工廠有合作，現場部署了人形機器人去做搬運，包括國內別的一些人形機器人也跟汽車工廠有些合作。這個目前基本上還是處於試點階段，還沒有到真正的商業閉環，比如一臺機器人它產生的商業價值是正向的，比人工更便宜。

目前宇樹科技的四足機器人營收佔比是怎樣的？人形機器人的快速發展，對於四足機器人來說是機遇還是挑戰？

王興興：目前消費端產品可能佔了整個機器狗營收的1/3。

大家可能一直覺得我們做了人形機器人，會不會四足機器人顧不過來。但實際上，我們四足和人形機器人的兩個業務，很多人員是共用的，因爲兩個領域的硬件、電控系統、軟件、OTA升級平臺和AI算法等共用的地方非常多。

通用人形機器人領域什麼時候會出現一個iPhone時刻？AI大模型爲機器人領域帶來了哪些明顯的能力的提升，還存在哪些挑戰？

王興興：人形機器人離iPhone時刻還有很大距離。iPhone的出現，並不是說有一個特別技術突破了，更多是一個綜合性的技術突破。比如說原本已經有觸摸屏了，有很好的CPU，或者還有一些圖形界面。然後，喬布斯把終極產品的構想給提出來了，把這些技術都整合在一起。

在具身智能或者機器人AI這個領域，我覺得在今年年底之前，至少全球有一家公司或有個實驗室能把通用型的機器人AI模型給做出來。但這也不是iPhone時刻，因爲iPhone時刻標誌着這個行業的出貨量暴增。人形機器人真正的iPhone時刻會更遠一點，但是我覺得不會超過5年。

您之前提到過會考慮在機器人上面增加足夠多的觸覺感知，你認爲現在觸覺的重要性在哪裡以及瓶頸又是什麼？

王興興：我一直覺得觸覺是非常重要的一件事情。

對於一個人來說，假設你全身皮膚的觸覺喪失了，你可能抓一個東西都抓不住。再比如，如果你貼一張膠帶在貓的身體上，這個貓會發生很奇怪的動作。觸覺對整個哺乳動物來說，都是非常重要的一件事情。

但是，目前人形機器人觸覺的進展確實非常糟糕，機械臂上基本沒有觸覺傳感器。原因也比較簡單，觸覺傳感器非常不好做，因爲它要非常小且足夠的敏感，但敏感和可靠性天然存在矛盾。一個非常敏感的傳感器，就意味着非常容易壞，一旦受到碰撞，就會導致操作變形。

在您看來目前人形機器人發展最大的瓶頸是什麼？

王興興：當下的所有機器人最大的瓶頸，還是基層AI的能力在全球範圍內都沒有達到一個像初代GPT或者初代通用AI的能力。

目前雙臂機器人或者一個工業機器人，如果加了AI以後，它產生的人效比人低，比如速度比較慢，精度比較差，能幹的活比較少，它其實很難替代工業上面人的價值，這樣的話整個的商業閉環沒辦法跑通。

另外，當然目前可能硬件還是有些問題，比如硬件的機械臂的負載能力不夠，精度不太夠，成本有點高，但實際上這只是工程上的問題。如果現在機器人AI哪家公司能做一個突破，我們年底前就可以直接量產10萬個機器人。

您如何看待現在智能機器人的行業的競爭格局？您覺得中小公司的機會在哪？

王興興：中小公司目前最大的點，就是你得對前沿技術保持足夠高的敏感度，你得看到未來，你得足夠靈活。如果能預估未來1年2年，甚至是5年以後的整個技術路線，整個產品格局，你提前做佈局，能不能做第一不太清楚，但你肯定死不了。

對於大公司而言，要做到這一點比較難。大公司內部的流程，內部團隊的相互競爭，然後資源和溝通的順暢性都不如中小公司。

另外，我們一直非常關注商業化。我們做人形機器人最主要也是我們衝着商業化去的，有客戶我們纔去做的這個方向。目前我們的人形機器人客戶比較雜，有個人的、科研教育的、AI公司的、科技公司的，還有一些工廠的項目落地等。我們基本的策略還是希望給大家提供本體，無論是個人買來玩也好，工廠裡面做一些應用也好，或者學校做一些研究，我們都完全歡迎。

現在機器人都還在投入期，您有沒有預估它什麼時候能到盈虧平衡，然後什麼時候能到一個市場爆發的時候？

王興興：盈虧平衡具體要看怎麼算了。其實我們公司還是保留了合理的利潤，相對來說最大的點還是希望有更多的機器人出貨量，有更多的人能使用機器人，這可能是更重要的。

還有一點，如果你投入大量的AI與人力，你可能很難盈虧平衡或者虧損會比較嚴重，因爲AI太費人了，燒錢也會比較嚴重一點，因爲算力比較貴。其實每家公司不太一樣，如果你AI投入少，可能就比較容易實現盈虧平衡，你如果AI投入大可能就很難實現。

所以，在人形機器人領域是不是不太存在“大力出奇跡”的可能性？

王興興：情況是這樣的。

如果一家大公司有財力和人力，我還是建議他可以多投入一點的。但是對我們這樣的創業公司，可能就不太合適，我們還是比較保守一點。因爲機器人的AI模型，其實不像大語言模型的技術路線沒有那麼清晰。

所以，在這個模型沒有清晰的階段，你如果投入大的財力和人力，其實你有點使不上勁的感覺。就是這條路你都不太清楚，然後你拼命往裡面跑，你也跑不了，對吧？

OpenAI當時投入大量精力去做ChatGPT的提前是，他們內部已經驗證了模型是ok的。他們做了一個ChatGPT模型出來，然後給他餵了不少的算力和資源，發現效果其實非常明顯，然後再繼續加算力和資源發現效果依然很明顯。而不是，他們在模型還不太清楚的時候就亂投入。

大家如果去看一下OpenAI早期的發展經歷，可以看到他早期幾年做的事情很雜，機器人的AI模型他們也做過。後來他們發現GPT這個模型可以大力出奇跡以後，把資源都給彙總起來，專門做GPT。

但現在像機器人這個領域，目前你要說哪個方向特別正確，還比較難判斷。目前相對公認的是，特斯拉要搞的就是這個方向，通過堆數據是有效果的。不過，堆數據也只是針對單個的細分場景，更大範圍的驗證效果如何，目前還不太確定。（本文首發於鈦媒體APP，作者 | 饒翔宇編輯 | 鍾毅）

對話宇樹科技創始人王興興：人形機器人大模型，還沒走到“大力出奇跡”階段

相關資訊