成立 1 年估值超 100 億、紅杉軟銀爭投,這家人形機器人公司做對了什麼?

機器人行業的「GPT-3」時刻已經出現?

作者 | 芯芯編輯| 靖宇

具身智能,或者說人形機器人,現在已經成爲僅次於 AI、最熱門的投資項目。無論是 OpenAI、英偉達或者是微軟,都在砸下重金投資人形機器人團隊。

現在,一個種子選手,正在獲得巨頭們的青睞。

近日,一家名爲 Skild AI 的公司,宣佈完成 3 億美元的 A 輪融資,投資者包括傑夫·貝佐斯、日本軟銀集團、紅杉資本和卡內基梅隆大學等,使該公司估值達到 15 億美元。

這家公司才成立不到一年,由兩名機器人領域的大學教授創立,其團隊正在構建一個「可擴展的機器人基礎模型」,作爲各種類型機器人和各種現實應用場景的通用「大腦」,同時還在構建可以改裝到機器人硬件上的系統。

該公司稱,「我們的長期目標是開發基於物理世界的通用人工智能(AGI),挑戰 AGI 只能從數字知識中產生的流行觀念。」

投資人爲此迅速投錢,認爲機器人行業的「GPT-3 時刻即將到來」。

Skild AI 到底做對了什麼?它能實現 AI+具身智能的野心嗎?

01

「機器人大模型」

Skild AI 由卡內基梅隆大學教授 Deepak Pathak 和 Abhinav Gupta 於 2023 年 5 月創立,正在開發基於物理世界的智能系統,構建機器人基礎模型——可以理解爲「機器人大腦」。

他們在做的東西有什麼特別?傳統機器人技術側重於收集特定數據,來訓練機器人以完成特定任務,而 Deepak 和 Abhinav 則利用大規模數據,通過基於 Transformer 的自適應架構構建基礎模型,想要創建的是一個通用、魯棒且具備涌現行爲的機器人模型。

這家公司稱,自己正在突破機器人數據壁壘,其訓練模型的數據量「是競爭對手模型的千倍以上」。與那些爲特定應用垂直設計的機器人不同,Skild 的模型作爲各種機器人形式、場景和任務的「通用」大腦,涵蓋操作、移動和導航等功能。

在現實世界應用中,從在惡劣物理中具備韌性的「四足機器人」,到能夠進行復雜家庭和工業任務的「人形機器人」,該公司的模型據稱都能用上。

那麼,在理論上,這種「機器人大腦」可以爲波士頓動力公司的四足機器人「Spot」以及 Agility Robotics 的人形機器人「Digit」提供「動力」,儘管公司尚未宣佈具體合作伙伴。

構建「通用的」機器人基礎模型| 圖片來源:Skild AI

Skild AI 稱自己的使命是「通過開發首個真正智能的實體系統,徹底改變未來的體力工作,旨在提升生產力和挖掘人類潛力。」願景是「建立扎根於物理世界的通用人工智能(AGI)」。

儘管全球不少人都擔心 AI 或機器人搶工作,做機器人的公司普遍還是喜歡說自己要解決所謂的「勞動力短缺問題」,抑或者更高遠的「解放人類」。

Skild AI 顯然也不例外。

他們對外強調的說法是,以美國爲例,目前面臨着嚴重的勞動力短缺,空缺的工作崗位比失業人數多出 170 萬個。醫療保健、建築、倉儲和製造業等行業受影響最嚴重,預計到 2030 年將有 210 萬個製造業職位空缺。

此外,許多這些工作對人類來說可能是危險的,例如石油鑽井平臺和機器房。而 Skild 的模型使機器人能夠適應在危險環境中執行新任務,而不是由人類執行這些任務。

Skild AI 的聯合創始人 Abhinav Gupta 稱,「通用機器人能夠在任何環境下、安全地執行任何自動化任務,並具備任何類型的實施形式,我們可以擴展機器人的能力,降低其成本,並支持嚴重人手不足的勞動力市場。」

Skild AI 稱該大腦可以適應各種硬件和任務 |Skild AI

機器人行業的人常說「機器人技術很難」,這幾乎成了支配該領域的無名自然法則之一。

而且,不少人認爲機器人是一個硬件問題,但 Skild AI 的創始人卻認爲這是一個軟件問題。

Skild AI 強調「規模是關鍵」,並表示他們正在發明最前沿的機器學習算法,「重點是利用規模的力量,在任何環境中提供無與倫比的魯棒性。從建築工地到工廠再到家庭,Skild Brain 能像人類一樣適應非結構化環境。」

這個「Skild Brain」,就是所謂的大腦,據稱是「首個可擴展的」機器人基礎模型,可以適應不同的硬件和任務,「在模型設計上具有魯棒性。」

該公司還披露了一個 Skild AI 移動操控平臺,由 Skild Brain 提供動力,在這個平臺上「可以開發用於機器人的高級 AI 算法和應用程序」,他們想要「使機器人操作像調用 API 一樣簡單」。目前,該平臺尚未開放,僅允許感興趣的開發者註冊,加入早期訪問等待名單。

此外,他們推出了一個安全/檢查機器人平臺,稱提供自動化視覺檢查、數據收集或巡邏任務的解決方案。

Skild AI 的創始團隊 |圖片來源:Skild AI

今年 7 月,Skild AI 宣佈完成 3 億美元的 A 輪融資,融資由 Lightspeed Venture、Coatue、軟銀集團和傑夫·貝佐斯(通過 Bezos Expeditions)領投,Felicis Ventures、紅杉資本、Menlo Ventures、General Catalyst、CRV、亞馬遜、SV Angel 和卡內基梅隆大學參與了本輪融資。這次融資使公司的估值達到 15 億美元。

Skild AI 表示,將利用這筆新資金改進其 AI 模型,同時追求商業化落地部署。長期目標是創造一種「具有與人類同等能力」且「紮根於物理世界」的 AGI。

其首席執行官兼聯合創始人 Deepak Pathak 稱:「我們相信 Skild AI 代表了機器人技術擴展方式的一個轉折點,具有改變整個實體經濟的潛力。」

02

印度機器人大神創業

根據公司網站顯示,Skild AI 正在招聘多個工程師崗位。目前團隊包括來自 Meta、特斯拉、英偉達、亞馬遜和谷歌背景的成員,以及卡內基梅隆大學的學生。

兩名聯合創始人 Deepak 和 Abhinav,都曾是卡內基梅隆大學的教授,在機器人和 AI 領域有多年研究經驗,以其在自監督機器人技術、好奇驅動的智能體和自適應機器人學習等領域的研究聞名。

如果要量化其學術水平,他們兩人目前擁有 150+的 H 指數,超過 90000 次引用。

Skild AI 聯合創始人 Deepak(左)和 Abhinav(右)|圖片來源:Skild AI

Deepak 來自印度的一個小鎮,在同齡人搬到大城市備戰全國考試時,他留在小鎮,仍然考上了印度理工學院(即 ITT),這是印度國內的最高學府,這一成就還登上了當地頭條。

據稱,在印度時,由於缺乏條件,他還曾在家裡用紙手寫代碼並檢查,然後在當地咖啡館有限的上網時間裡運行他編寫的程序。後來這個印度的「小鎮傳奇」就赴美國讀博,期間加入 Facebook AI 研究院(FAIR)做研究,還創辦過一家被收購的初創公司,後來選擇當教授。

Abhinav 則是卡內基梅隆大學的終身教授,和 Deepak 同爲印度裔,曾是 FAIR 機器人研究組的創始成員和研究負責人。他和 Deepak 討論了十年創業的可能性。2023 年初,他們看到了自己領域技術進步的加速,意識到是時候出來大幹一場了。

那麼,他們看到的機會具體是什麼?在追求爲機器人構建通用智能的過程中,關鍵挑戰一直是如何在沒有大規模數據的情況下,構建一個大型模型。

與大型語言模型不同,機器人領域沒有現成的互聯網數據。因此,他們探索了從現有資源中學習的不同策略:在線視頻、遠程操作、現實世界數據、模擬等。

2015 年,他們首次實現了機器人數據的 1000 倍擴展,隨後幾年,他們嘗試了人類遠程操作和低成本機器人遠程操作平臺。2017 年,他們提出了著名的好奇心驅動學習算法,用於構建能夠自主探索和學習的智能體。2021 年和 2022 年,他們再次突破,採用大規模自適應 SIM2REAL(虛擬到現實世界訓練)策略,並在機器人學習會議上獲得最佳機器人系統獎。

這些成就,奠定了 Skild AI 的目標:一個通用模型,能夠在任何環境中完成任何任務,而無需特定訓練。有投資方認爲,如果 Deepak 和 Abhinav 能實現這一目標,他們將取得類似 GPT-3 的突破,結果可能適用於幾乎所有領域。

03

機器人的

「GPT-3 時刻」?

卡內基梅隆大學現任機器人研究所所長 Matthew Roberson 爲他們站臺背書稱,「Skild AI 由站在機器人技術創新前沿的的專家創立,我迫不及待地想見證他們的尖端技術如何徹底改變行業,並延續卡內基梅隆大學在轉化研究方面的悠久歷史。」

其他投資方也不吝吹捧,似乎對 Skild AI 的能力和前景充滿信心。他們大多看中的是兩名創始人對世界上一些先進機器人和 AI 實驗室的貢獻。

在過去幾年,互聯網偶爾會被機器人極限跑酷、用手操控物體(包括開門和抽屜)、爬樓梯(無論是前進還是後退,室內還是室外)、以及自然流暢移動的機器人震撼一下,而這些進步,據稱背後都可以追溯到兩人的一些學術成果。

有的投資人稱他們是機器人技術進步的「催化劑」,認爲「他們在將基礎模型的核心原則應用於現實世界方面的創新,使行業走上了通用機器人技術的道路。」

有的投資人提出,Skild AI 在構建機器人操作和移動的基礎模型方面,「採用了真正可擴展的方法」,「他們革命性地改變機器人技術,從預編程機器人轉向動態自適應機器人,這有可能顛覆整個實體經濟。」

還有投資方已經投資機器人公司超過 15 年,稱 Skild 是其見過「最具遠見的」,「他們正在構建的模型將在任何環境、任何硬件上執行任何任務。」

在 Felicis Ventures 的投資人看來,開發通用機器人智能的競賽已經開始,沒有任何一個想法能像現在這樣快速地動員資本和人才,通用機器人基礎模型將成爲這一鏈條中的關鍵環節。

創造一個能夠在任何環境中、任何形式上進行推理、規劃和行動的「單一模型」,這個想法並不新鮮,一直是機器人行業想要奪取的聖盃,「這個想法的問題在於,幾年前它根本不可能實現。而今天,它可能成爲現實。」Felicis Ventures 的投資人如此稱。

「當我們第一次飛往匹茲堡觀看 Skild 機器人實際操作時,我們簡直不敢相信自己的眼睛。一個初創公司在如此短的時間內怎麼可能取得如此大的成就?」

「答案在於規模。大型預訓練視覺語言動作模型(VLA)展現出與大型預訓練語言模型(LLM)相同的涌現行爲,正如在代數上訓練一個 LLM 使其在西班牙語上表現得更好。」Felicis Ventures 的投資人認爲「Skild 正在將這一理念推向極致。」

Skild 正在做和想要實現的,就是通過所謂千倍以上的訓練數據量,讓機器人從沒見過的任務也能執行到位,該投資人稱已經看到了跡象。

紅杉資本的投資人也聲明稱,對 Skild AI 的團隊充滿「深刻的信念」,說他們「有潛力在現實世界中實現 OpenAI 在數字世界中所取得的成就。」

信念的一個證明是,飛速給錢。見完創始人不到一週時間內,紅杉資本就拍板決定投資 Skild AI,認爲這個團隊就是他們追求的,稱「GPT-3 時刻即將到來,將爲機器人世界帶來巨大變革,就像我們在數字智能世界中看到的進步一樣。」

這些投資人認爲,雖然關於 AI 對人類生活影響的討論非常熱烈,但迄今爲止,大量討論仍然主要集中在軟件上,而將 AI 整合到機器人中則潛藏着巨大的機會,AGI 不是隻能通過數字知識來構建。雖然一切都處於早期階段,但利用 LLM、VLM 和代碼生成的進步,機器人制造商有機會開發更智能的機器。

「想象這樣一個世界:一個 AI 機器人基礎模型能夠在任何環境、任何機器人硬件上完成任何任務。這將大大擴展我們可以構建的機器人類型,並且成本將比今天低幾個數量級。」

隨着軟件領域的 AI 成爲巨頭的遊戲,以及將 AI 整合到機器人的前景和吸引力。

一波 AI 熱錢,已經轉向機器人領域。

*頭圖來源:Skild AI

本文爲極客公園原創文章,轉載請聯繫極客君微信 geekparkGO

極客一問

你如何看好 AI+具身智能嗎?

馬斯克:我確實要小心一點,過去7個月有兩個人想刺殺我。

點贊關注極客公園視頻號,