特斯拉 Optimus 機器人進展:已經生產數百臺、還擰不好螺絲

文丨賀乾明 李梓楠編輯丨賀乾明 黃俊杰

“就算我明天被外星人綁架,特斯拉也會解決自動駕駛問題。但我不知道特斯拉怎麼在 Optimus 上贏。” 今年 4 月的財報會上,馬斯克給出他該拿 500 億美元薪酬的一個理由。

一位接觸過特斯拉團隊的人告訴我們,在馬斯克說這番話前不久,他就要求人形機器人團隊在今年內拿出有意義的突破——讓機器人能上產線完成部分工作,如果達不到就進一步裁員,“團隊承受的壓力越來越大”。

我們得知,Optimus 人形機器人目前已經生產數百臺,但還不到可以上產線工作的狀態,目前只能用來採集數據、測試不同的設計方案。

這個 2021 年開始推進的人形機器人項目與特斯拉開發其他產品的邏輯截然相反。造車,特斯拉從高利潤的電動跑車 Roadster 起步,逐步提升生產效率,造出便宜的 Model 3。自動駕駛也是從低到高,邊賣邊提升。

而在人形機器人上,馬斯克要一步到位,量產就得是終極形態:成本低到 2 萬美元以內——低於一個美國藍領的年收入;但足夠智能,能替代一部分工人的工作。

過去 3 年,馬斯克公開場合中談論 Optimus 的次數迅速追上自動駕駛、Robotaxi,將其視爲撐起特斯拉估值的希望,“如果我們擁有具備感知能力的人形機器人,能根據要求執行任務,生產力會大幅提高,經濟增長就不存在限制。”

中國的股市已經炒作了幾輪特斯拉機器人供應鏈概念股,但馬斯克的宏偉故事並沒有怎麼提振特斯拉的股價。從 2022 年的高點以來,特斯拉的市值已經跌掉近 40%。

特斯拉機器人團隊面前的挑戰是,一步到位造出像人一般行動的機器人基本不可能。目前他們只能採取一些工程上的妥協,可能針對特定的工作場景,比如擰螺絲,專門訓練模型,讓人形機器人先發揮一部分作用。至於妥協的結果馬斯克能不能接受,還不得而知。

最大的困難:造人,而不是造人形機械裝置

根據《馬斯克傳》,2021 年初,馬斯克在特斯拉高管會上播放了波士頓動力人形機器人 Atlas 的視頻,畫面中人形機器人可以像人一樣,靈活完成高難度動作。他告訴參會的高管,“不管你喜不喜歡,人形機器人都會出現。我們應該入局。”

他的目標很明確:必須是一款人形,並且體態和人一樣的機器人,而不是波士頓動力公司或其他公司造的四條腿或者帶輪子的機械裝置。而且機器人得像人一樣以視覺觀察學習,學會用手完成工作,而不是像波士頓動力或者傳統的機械臂公司那樣,讓工程師預先輸入每一行工作指令。

此前的機器人都針對專門場景設計,導致不夠通用,產能有限。根據國際機器人聯合會數據,2023 年,全球工業機器人的總銷量只有 59 萬臺——大約是勞力士手錶產量的一半。這 59 萬臺還是至少數十種互不通用的專門形態,大部分年產幾百臺,完全沒有規模效應。

現在所有人形機器人公司都在講特斯拉機器人的故事:我們的工作場所和工具都是爲人而設計。如果人形機器人成真,不需要定製開發,就能以一套硬件完成多種任務,大規模生產同一種型號就有了可能。馬斯克談論人形機器人項目時,經常把規模掛住嘴邊,要生產百萬臺、千萬臺,甚至十億臺,“量產對於人形機器人來說同樣重要,這樣才能做到不那麼貴。”

區別在於,沒有幾家人形機器人公司在堅持做人形,它們通常選擇折中路線,用各種夾具替代人手或者用輪子替代雙腿,先解決一部分問題、產生部分商業價值,再一步步向人形迭代。

但馬斯克不妥協。在每週召開的人形機器人討論會上,他拒絕了大量不像人的設計方案,比如在機器人手臂上裝不同的工具,執行不同任務,他認爲只用手就足夠了。

特斯拉的工程師還覺得機器人的小拇指沒什麼用,但因爲拿掉小拇指 “太驚悚”、太不像人,保留了下來,替代方案是延長小拇指長度,讓它能發揮更多作用。馬斯克還非常具體地要求,機器人的手指要有女性手指的錐度。他設定機器人身高爲 5 英尺 8 英寸高(接近 1 米 73),比美國成年男性平均身高略矮;要求機器人看上去像雌雄同體的精靈,這樣 “你就不會覺得它可能要傷害你”。

一位接觸過特斯拉團隊的投資人說,馬斯克對人形的堅持,是爲了換掉制約汽車製造的最後一個環節——工人。那時特斯拉已經徹底擺脫產能地獄,上一年賣出 50 萬臺車,持續攀升的股價推動馬斯克成爲世界首富。但特斯拉位於加州的汽車工廠每週生產 8550 輛車,逼近產能極限。特斯拉意識到工人的效率已經到達極限,想要更快,只能造比人更強的工具。

汽車製造是自動化程度最高的工業生產工序之一。1960 年代誕生的機械臂,首要場景就是用到汽車工廠中搬運、焊接零部件。特斯拉的汽車工廠中,只有最後的總裝環節還需要大量工人蔘與,用他們的腿在工站中小範圍移動,用手組裝零部件,或拿着電鑽擰螺絲等。想要替代他們,最根本的方法是造出來類似的人。

如果一個機器人能通過機器學習的方式 “理解” 如何工作,像人一樣行走、擡手完成特斯拉汽車工廠裡的工作,那它應該也能用在其他工作中,產生規模效應。這是一個自然的邏輯推導,只是裡面的每一個前提都困難重重,三年下來,特斯拉的團隊甚至還沒有明確的實現路徑。

模糊的探索:如何用機械部件模擬人

特斯拉之前,全球的科學家已爲製造一臺能用的人形機器人研究了近 50 年。他們面臨的任務從始至終都很容易理解,用金屬、塑料、硅等材料模擬人的骨骼和血肉,造出一個能像人一樣思考、運動的機器。

行業中最出名的人形機器人是波士頓動力製造的 Atlas,能後空翻、在不平整的草地上快速奔跑、在室內靈活跳舞。但波士頓動力在一開始就放棄製造人最獨特的兩個器官——手和大腦。Atlas 能完成高難度動作,但僅限於提前設定好的動作,雙臂的末端是哆啦 A 夢那樣的圓疙瘩。

特斯拉開發人形機器人時,最先做的就是人手。人手有 27 個自由度、行動靈活,遍佈高敏感的觸覺神經,力控能力強大。

早期的方案中,特斯拉給機器手裝了 6 個驅動電機,讓 Optimus 能握住大部分物體,但遠稱不上靈活。五根手指中,只有大拇指裝了 2 個電機,能夠向內彎曲和左右搖擺,剩餘 4 根手指只裝了能控制彎曲的單個電機搖擺。手部的每個驅動器上都有連着電機的金屬線,電機收放金屬線時手指相應彎曲伸展。

第二代 Optimus 的手目前只有 11 個自由度。今年 5 月,馬斯克聲稱今年內會將 Optimus 手部自由度提升到 22 個,向人手靠近。現在特斯拉已經有了新一代機械手的方案。

但人手是血肉長在一起的,而不是像機器手那樣由不同的零件焊接或者鉚接而成。人手在運動時,手腕不會碰撞前方的手掌,動力也不會在人手內部損耗,但這些問題可能在機器手上發生。機器手結構的整體性,關係到手部動作的穩定性和連貫性。特斯拉拿掉了 Optimus 手部的諸多連桿裝置,改用電纜製成的繩驅來模仿人手肌肉組織,希望儘量減少機器手運動時產生的動力損耗和遲滯。

人通過肢體變形和神經末梢收到的擠壓感知壓力,Optimus 則是通過執行器的電流大小測量壓力,執行器爲 Optimus 提供握住物體的動力,電流大小對應輸出的力量大小。人手有數以萬計的觸覺傳感器,Optimus 的手只有 6 個壓力傳感器,而且無法感受溫度。

腿部關節上,特斯拉採用了部分線性執行器,與傳統的旋轉執行器相比,線性執行器可以縱向佈局,最大限度利用腿部內部空間,佈置更大更長的電機,提供更大的推動力,第二代 Optimus 的腿部執行器強度足以拉起一架半噸的鋼琴。但這樣做的壞處是,機器人腿部的平衡更難控制,控制算法的開發難度成倍上升。

在讓 Optimus 走路之前,特斯拉還測量了人腿每個關節在行走時的傳動機制和每個關節的扭矩,讓 Optimus 的動作儘可能像人。從結構上看,人的膝蓋是一個高效的四連桿裝置,四根骨頭加上骨頭的膝關節就能勝任走路、跳、下蹲等動作,並精確控制重心讓人保持平衡不摔倒。Optimus 目前只能做到緩慢行走,還無法順利完成下蹲等動作。

數百根骨頭和數十個關節連接而成人體有超過 200 個自由度,特斯拉簡化到 Optimus 驅乾的 28 個自由度。這些自由度由三種不同尺寸的旋轉執行器和三種線性執行器實現。旋轉執行器分佈在需要大角度旋轉的肩膀和髖部,線性執行器分佈在膝、肘等擺動角度小的部位。

每個執行器都配備絲槓、減速器、電機、傳感器和編碼器等部件。電機爲執行器提供動力,絲槓將部件旋轉的力轉化爲拉伸的力,控制關節收縮和伸展;減速器的作用類似人類骨骼和關節的連接處,能通過槓桿作用放大力量。

提升身體自由度只是用 Optimus 模擬人的第一步。特斯拉還在持續給 Optimus 減重,這能讓它相同的功率下完成更多任務。第二代的 Optimus 重量爲 56.6 公斤,輕於成年人類。

要做好人形機器人,靈活、耐用、穩定且成本可控的硬件部件和材料只是基礎。比如人能接住移動的物體,是因爲人腦對重力、加速度等物理規律有認知,因而能預判軌跡,身體又有運動能力,才能完成這個看似簡單的動作。

2022 年,特斯拉把汽車上的 FSD(完全自動駕駛)中的機器視覺神經網絡移植到 Optimus 上。像教汽車開車那樣,讓 Optimus 認識現實世界並作出適當的反應,讓它從人類的動作中學習並進步。

“自動駕駛是要求汽車在一個 2D 世界裡避免碰撞任何物體,但機器人的任務是在 3D 世界裡主動碰撞、接觸無窮多的事物。” 一位接觸過特斯拉團隊的投資人說,整個自動駕駛需要面臨的技術複雜度還遠不如機器人的一隻手。

“更大的問題是機器人領域沒有 Scaling Laws。” 一位機器人領域投資人說,這是整個智能機器人行業面臨的難題,一方面是他們找不到足夠多的數據訓練機器人模型,另一方面是沒有合適的模型架構能消化海量數據。

特斯拉從去年開始招聘人類來當 Optimus 的老師,明確要求身高在 170cm-175cm 之間,與機器人相仿。這些人要帶上傳感器遍佈全身的動作捕捉裝置,向機器人演示,人如何運用自己的關節進行活動。一些分析人士猜測,特斯拉未來可能會從海量的視頻中抽取人類運動的關鍵數據,餵給 Optimus 學習,這或許能加快它的學習速度。

按照目前的進度,人形機器人要達到馬斯克的最低要求,去特斯拉的汽車工廠中替代一部分工人,還需要漫長的學習和訓練。一位特斯拉分析師說,到今年年中,Optimus 在長度超過 500 米的行走測試中通過率只有不到 60%。

它的對手是時薪 22 美元的美國得州小時工,這些工人基本能在 50 秒內完成拾取零件、找對位置完成組裝、複覈質量等一系列複雜任務。這些人不會走 500 米路就摔倒等人扶,能與其他人完成複雜的溝通、協作,而他們還遠遠不是全球效率最高、工資最低的工人。

馬斯克目前只能說出兩項 Optimus 強於人類的地方,它比人類更認真,不開小差;它充滿電可以連續工作 16 個小時。

超前的準備:概念階段就開始考慮量產

“(人形機器人)量產極度困難,是被低估的。”2021 年 8 月的 AI Day 召開時,特斯拉的人形機器人項目還是一個概念,馬斯克就預示了即將面臨的困難。

設計人形機器人時,特斯拉的團隊就在尋找各種辦法降低量產的成本和難度。據《馬斯克傳》,一個典型的例子是如何讓機器人手控制施加的壓力和感受壓力。

工程師們提出了多種方案,比如用指關節中執行器的電流測量壓力,在指尖上放置類似手機觸摸屏上用到的電容器,或者是嵌入氣壓傳感器或芯片,以及放一個微型攝像頭。

機器人行業慣常的做法是在人手的關節處安裝壓力傳感器,這樣成本更高且更難造。

看到這些方案,特斯拉首席設計師馮·霍爾茲豪森(Von Holzhausen)只提出了一個問題:成本上有什麼區別?最後確定的方案是用關節中的電流,因爲不會增加零部件——成本可控,容易生產。

特斯拉造車積累的經驗和資源,也遷移到了人形機器人項目中。人形機器人中的電機、電池、軟件系統等,早期版本都是從電動車上類似的零部件改造而來,後續也會用特斯拉建立多年的軟件基礎設施優化。

就像分析電機如何驅動電動車在城市中穿行的那樣,他們用仿真系統,模擬人形機器人的 28 個關節各自執行多種動作的性能,找出其中的共性,簡化成 6 種單位成本和重量較低的方案。

現階段的 Optimus 有很多顯而易見的問題。接近特斯拉的人士稱,軟件團隊還在想辦法用代碼取代 Optimus 腳踝上的兩個六維力傳感器,它們笨重又昂貴,而且只給機器人的穩定性提供了部分冗餘。

對特斯拉來說,量產人形機器人最大的挑戰是讓它有用,足夠好用。目前特斯拉還未建成機器人流水線,只能手動組裝,單臺機器人的造價約等於 10 萬美元,但它現在能創造的價值微乎其微。

等開發完足夠有用的機器人,特斯拉還要從頭開始建設一條低價的供應鏈。

人形機器人中用到的各種零部件,整個行業中雖然有生產經驗,但通常用在高端製造場景中,價格居高不下。比如滾珠絲槓一般用在造價高昂的重型機械或航天設備中。特斯拉做了超前準備,機器人設計還沒有定型,團隊就開始着手搭建低成本的供應鏈。

從 2022 年中開始,特斯拉就開始讓中國的零部件供應商送零部件測試。其中比較有代表的是特斯拉電動車供應商拓普和三花智控,組裝執行器。它們是特斯拉長期供應商,供應車上的鑄鋁結構件。具體到零部件層面,還有鳴志電器爲特斯拉送樣機器人手用到的空心杯電機、綠地諧波送樣了關節執行器中用到的諧波減速器等。

這些零部件供應商最終能否進入特斯拉機器人產業鏈,還存在諸多不確定。成本是中國供應商的優勢。一位機器人領域分析師說,同一個零部件,中國公司的價格至少比海外知名公司便宜 30%,甚至有些會便宜 80%。但雙方的性能還有不小差距。我們瞭解到,今年中開始的 C 輪第一批送樣中,基本沒有中國零部件供應商通過特斯拉的要求。

一位接觸過特斯拉團隊的投資人說,特斯拉內部的目標是在中國之外建立一條人形機器人供應鏈。這意味着,中國公司想爲特斯拉機器人供貨,需要先海外投資建工廠。

特斯拉在美國的奧斯汀工廠組裝了一批用來測試的人形機器人,截至今年 6 月只有兩臺在工廠中搬運電池。用成本超過 10 萬美元的人形機器人搬運鋰電池並無任何價值。電池工廠一般用成本不到 1 萬美元,帶托盤的無人移動小車裝電池,一次能搬上千只。

馬斯克再一次啓動了他習以爲常的循環:用不切實際的時間表,推着團隊成員超越極限,在一次次延期中逼近目標。不過有時候,預期與現實之間的鴻溝會大到一兩代人也填不滿,比如愛迪生一百年前力推的電動車。

題圖:視覺中國