☰

成立 1 年估值超 100 億、紅杉軟銀爭投，這家人形機器人公司做對了什麼？

機器人行業的「GPT-3」時刻已經出現？

作者 | 芯芯編輯| 靖宇

具身智能，或者說人形機器人，現在已經成爲僅次於 AI、最熱門的投資項目。無論是 OpenAI、英偉達或者是微軟，都在砸下重金投資人形機器人團隊。

現在，一個種子選手，正在獲得巨頭們的青睞。

近日，一家名爲 Skild AI 的公司，宣佈完成 3 億美元的 A 輪融資，投資者包括傑夫·貝佐斯、日本軟銀集團、紅杉資本和卡內基梅隆大學等，使該公司估值達到 15 億美元。

這家公司才成立不到一年，由兩名機器人領域的大學教授創立，其團隊正在構建一個「可擴展的機器人基礎模型」，作爲各種類型機器人和各種現實應用場景的通用「大腦」，同時還在構建可以改裝到機器人硬件上的系統。

該公司稱，「我們的長期目標是開發基於物理世界的通用人工智能（AGI），挑戰 AGI 只能從數字知識中產生的流行觀念。」

投資人爲此迅速投錢，認爲機器人行業的「GPT-3 時刻即將到來」。

Skild AI 到底做對了什麼？它能實現 AI+具身智能的野心嗎？

「機器人大模型」

Skild AI 由卡內基梅隆大學教授 Deepak Pathak 和 Abhinav Gupta 於 2023 年 5 月創立，正在開發基於物理世界的智能系統，構建機器人基礎模型——可以理解爲「機器人大腦」。

他們在做的東西有什麼特別？傳統機器人技術側重於收集特定數據，來訓練機器人以完成特定任務，而 Deepak 和 Abhinav 則利用大規模數據，通過基於 Transformer 的自適應架構構建基礎模型，想要創建的是一個通用、魯棒且具備涌現行爲的機器人模型。

這家公司稱，自己正在突破機器人數據壁壘，其訓練模型的數據量「是競爭對手模型的千倍以上」。與那些爲特定應用垂直設計的機器人不同，Skild 的模型作爲各種機器人形式、場景和任務的「通用」大腦，涵蓋操作、移動和導航等功能。

在現實世界應用中，從在惡劣物理中具備韌性的「四足機器人」，到能夠進行復雜家庭和工業任務的「人形機器人」，該公司的模型據稱都能用上。

那麼，在理論上，這種「機器人大腦」可以爲波士頓動力公司的四足機器人「Spot」以及 Agility Robotics 的人形機器人「Digit」提供「動力」，儘管公司尚未宣佈具體合作伙伴。

構建「通用的」機器人基礎模型｜圖片來源：Skild AI

Skild AI 稱自己的使命是「通過開發首個真正智能的實體系統，徹底改變未來的體力工作，旨在提升生產力和挖掘人類潛力。」願景是「建立扎根於物理世界的通用人工智能（AGI）」。

儘管全球不少人都擔心 AI 或機器人搶工作，做機器人的公司普遍還是喜歡說自己要解決所謂的「勞動力短缺問題」，抑或者更高遠的「解放人類」。

Skild AI 顯然也不例外。

他們對外強調的說法是，以美國爲例，目前面臨着嚴重的勞動力短缺，空缺的工作崗位比失業人數多出 170 萬個。醫療保健、建築、倉儲和製造業等行業受影響最嚴重，預計到 2030 年將有 210 萬個製造業職位空缺。

此外，許多這些工作對人類來說可能是危險的，例如石油鑽井平臺和機器房。而 Skild 的模型使機器人能夠適應在危險環境中執行新任務，而不是由人類執行這些任務。

Skild AI 的聯合創始人 Abhinav Gupta 稱，「通用機器人能夠在任何環境下、安全地執行任何自動化任務，並具備任何類型的實施形式，我們可以擴展機器人的能力，降低其成本，並支持嚴重人手不足的勞動力市場。」

Skild AI 稱該大腦可以適應各種硬件和任務｜Skild AI

機器人行業的人常說「機器人技術很難」，這幾乎成了支配該領域的無名自然法則之一。

而且，不少人認爲機器人是一個硬件問題，但 Skild AI 的創始人卻認爲這是一個軟件問題。

Skild AI 強調「規模是關鍵」，並表示他們正在發明最前沿的機器學習算法，「重點是利用規模的力量，在任何環境中提供無與倫比的魯棒性。從建築工地到工廠再到家庭，Skild Brain 能像人類一樣適應非結構化環境。」

這個「Skild Brain」，就是所謂的大腦，據稱是「首個可擴展的」機器人基礎模型，可以適應不同的硬件和任務，「在模型設計上具有魯棒性。」

該公司還披露了一個 Skild AI 移動操控平臺，由 Skild Brain 提供動力，在這個平臺上「可以開發用於機器人的高級 AI 算法和應用程序」，他們想要「使機器人操作像調用 API 一樣簡單」。目前，該平臺尚未開放，僅允許感興趣的開發者註冊，加入早期訪問等待名單。

此外，他們推出了一個安全/檢查機器人平臺，稱提供自動化視覺檢查、數據收集或巡邏任務的解決方案。

Skild AI 的創始團隊｜圖片來源：Skild AI

今年 7 月，Skild AI 宣佈完成 3 億美元的 A 輪融資，融資由 Lightspeed Venture、Coatue、軟銀集團和傑夫·貝佐斯（通過 Bezos Expeditions）領投，Felicis Ventures、紅杉資本、Menlo Ventures、General Catalyst、CRV、亞馬遜、SV Angel 和卡內基梅隆大學參與了本輪融資。這次融資使公司的估值達到 15 億美元。

Skild AI 表示，將利用這筆新資金改進其 AI 模型，同時追求商業化落地部署。長期目標是創造一種「具有與人類同等能力」且「紮根於物理世界」的 AGI。

其首席執行官兼聯合創始人 Deepak Pathak 稱：「我們相信 Skild AI 代表了機器人技術擴展方式的一個轉折點，具有改變整個實體經濟的潛力。」

印度機器人大神創業

根據公司網站顯示，Skild AI 正在招聘多個工程師崗位。目前團隊包括來自 Meta、特斯拉、英偉達、亞馬遜和谷歌背景的成員，以及卡內基梅隆大學的學生。

兩名聯合創始人 Deepak 和 Abhinav，都曾是卡內基梅隆大學的教授，在機器人和 AI 領域有多年研究經驗，以其在自監督機器人技術、好奇驅動的智能體和自適應機器人學習等領域的研究聞名。

如果要量化其學術水平，他們兩人目前擁有 150+的 H 指數，超過 90000 次引用。

Skild AI 聯合創始人 Deepak（左）和 Abhinav（右）｜圖片來源：Skild AI

Deepak 來自印度的一個小鎮，在同齡人搬到大城市備戰全國考試時，他留在小鎮，仍然考上了印度理工學院（即 ITT），這是印度國內的最高學府，這一成就還登上了當地頭條。

據稱，在印度時，由於缺乏條件，他還曾在家裡用紙手寫代碼並檢查，然後在當地咖啡館有限的上網時間裡運行他編寫的程序。後來這個印度的「小鎮傳奇」就赴美國讀博，期間加入 Facebook AI 研究院（FAIR）做研究，還創辦過一家被收購的初創公司，後來選擇當教授。

Abhinav 則是卡內基梅隆大學的終身教授，和 Deepak 同爲印度裔，曾是 FAIR 機器人研究組的創始成員和研究負責人。他和 Deepak 討論了十年創業的可能性。2023 年初，他們看到了自己領域技術進步的加速，意識到是時候出來大幹一場了。

那麼，他們看到的機會具體是什麼？在追求爲機器人構建通用智能的過程中，關鍵挑戰一直是如何在沒有大規模數據的情況下，構建一個大型模型。

與大型語言模型不同，機器人領域沒有現成的互聯網數據。因此，他們探索了從現有資源中學習的不同策略：在線視頻、遠程操作、現實世界數據、模擬等。

2015 年，他們首次實現了機器人數據的 1000 倍擴展，隨後幾年，他們嘗試了人類遠程操作和低成本機器人遠程操作平臺。2017 年，他們提出了著名的好奇心驅動學習算法，用於構建能夠自主探索和學習的智能體。2021 年和 2022 年，他們再次突破，採用大規模自適應 SIM2REAL（虛擬到現實世界訓練）策略，並在機器人學習會議上獲得最佳機器人系統獎。

這些成就，奠定了 Skild AI 的目標：一個通用模型，能夠在任何環境中完成任何任務，而無需特定訓練。有投資方認爲，如果 Deepak 和 Abhinav 能實現這一目標，他們將取得類似 GPT-3 的突破，結果可能適用於幾乎所有領域。

機器人的

「GPT-3 時刻」？

卡內基梅隆大學現任機器人研究所所長 Matthew Roberson 爲他們站臺背書稱，「Skild AI 由站在機器人技術創新前沿的的專家創立，我迫不及待地想見證他們的尖端技術如何徹底改變行業，並延續卡內基梅隆大學在轉化研究方面的悠久歷史。」

其他投資方也不吝吹捧，似乎對 Skild AI 的能力和前景充滿信心。他們大多看中的是兩名創始人對世界上一些先進機器人和 AI 實驗室的貢獻。

在過去幾年，互聯網偶爾會被機器人極限跑酷、用手操控物體（包括開門和抽屜）、爬樓梯（無論是前進還是後退，室內還是室外）、以及自然流暢移動的機器人震撼一下，而這些進步，據稱背後都可以追溯到兩人的一些學術成果。

有的投資人稱他們是機器人技術進步的「催化劑」，認爲「他們在將基礎模型的核心原則應用於現實世界方面的創新，使行業走上了通用機器人技術的道路。」

有的投資人提出，Skild AI 在構建機器人操作和移動的基礎模型方面，「採用了真正可擴展的方法」，「他們革命性地改變機器人技術，從預編程機器人轉向動態自適應機器人，這有可能顛覆整個實體經濟。」

還有投資方已經投資機器人公司超過 15 年，稱 Skild 是其見過「最具遠見的」，「他們正在構建的模型將在任何環境、任何硬件上執行任何任務。」

在 Felicis Ventures 的投資人看來，開發通用機器人智能的競賽已經開始，沒有任何一個想法能像現在這樣快速地動員資本和人才，通用機器人基礎模型將成爲這一鏈條中的關鍵環節。

創造一個能夠在任何環境中、任何形式上進行推理、規劃和行動的「單一模型」，這個想法並不新鮮，一直是機器人行業想要奪取的聖盃，「這個想法的問題在於，幾年前它根本不可能實現。而今天，它可能成爲現實。」Felicis Ventures 的投資人如此稱。

「當我們第一次飛往匹茲堡觀看 Skild 機器人實際操作時，我們簡直不敢相信自己的眼睛。一個初創公司在如此短的時間內怎麼可能取得如此大的成就？」

「答案在於規模。大型預訓練視覺語言動作模型（VLA）展現出與大型預訓練語言模型（LLM）相同的涌現行爲，正如在代數上訓練一個 LLM 使其在西班牙語上表現得更好。」Felicis Ventures 的投資人認爲「Skild 正在將這一理念推向極致。」

Skild 正在做和想要實現的，就是通過所謂千倍以上的訓練數據量，讓機器人從沒見過的任務也能執行到位，該投資人稱已經看到了跡象。

紅杉資本的投資人也聲明稱，對 Skild AI 的團隊充滿「深刻的信念」，說他們「有潛力在現實世界中實現 OpenAI 在數字世界中所取得的成就。」

信念的一個證明是，飛速給錢。見完創始人不到一週時間內，紅杉資本就拍板決定投資 Skild AI，認爲這個團隊就是他們追求的，稱「GPT-3 時刻即將到來，將爲機器人世界帶來巨大變革，就像我們在數字智能世界中看到的進步一樣。」

這些投資人認爲，雖然關於 AI 對人類生活影響的討論非常熱烈，但迄今爲止，大量討論仍然主要集中在軟件上，而將 AI 整合到機器人中則潛藏着巨大的機會，AGI 不是隻能通過數字知識來構建。雖然一切都處於早期階段，但利用 LLM、VLM 和代碼生成的進步，機器人制造商有機會開發更智能的機器。

「想象這樣一個世界：一個 AI 機器人基礎模型能夠在任何環境、任何機器人硬件上完成任何任務。這將大大擴展我們可以構建的機器人類型，並且成本將比今天低幾個數量級。」

隨着軟件領域的 AI 成爲巨頭的遊戲，以及將 AI 整合到機器人的前景和吸引力。

一波 AI 熱錢，已經轉向機器人領域。

*頭圖來源：Skild AI

本文爲極客公園原創文章，轉載請聯繫極客君微信 geekparkGO

極客一問

你如何看好 AI+具身智能嗎？

馬斯克：我確實要小心一點，過去7個月有兩個人想刺殺我。

點贊關注極客公園視頻號，

成立 1 年估值超 100 億、紅杉軟銀爭投，這家人形機器人公司做對了什麼？

相關資訊