端到端下的智駕人:曾經年入百萬,如今焦慮失業
文丨李安琪
編輯丨李勤
“要麼擁抱端到端,要麼幾年後離開智駕行業。”
進入智駕行業數年,智駕工程師秦風(化名)原本已經適應智駕行業激烈的內卷節奏。但當新技術“端到端大模型”來臨時,他覺得首先被衝擊的可能不是人類司機,而是作爲工程師的自己。
這種焦慮並非秦風獨有。不少智駕工程師告訴36氪,爲了學習新技術,他們在工作加班的間隙看起了行業最新論文、去B站聽課,有的甚至從研究生課本開始學起。
“端到端大模型”是今年智能駕駛行業的最新技術炸彈。
今年1月,特斯拉麪向普通用戶正式推送了 FSD(自動駕駛軟件包) v12 的測試版本。該版本採用了端到端網絡方案,不少用戶稱效果經驗,比之前的v11版本要擬人得多。
馬斯克曾介紹端到端的能力,稱之爲“圖像端輸入,控制端輸出”。儘管多位行業人士向36氪表達,他們不相信特斯拉端到端方案在實操層面如此激進與神乎其技,但端到端依然如蜜般驅策着國內同行。國內玩家逐漸相信,在大模型、大算力、海量數據的驅動下,AI系統會像人類一樣開車。
嗅到新的技術風潮,國內的車企與頭部智駕公司已經付諸行動。華爲、蔚小理、比亞迪等頭部玩家都投入了團隊與資源推進端到端方案;理想與蔚來兩家車企,還成立了專門的端到端大模型部門,以更快推進技術落地。
高端人才的爭奪也在明暗處涌動。在第一款車推向市場之際,爲追上智駕進度,小米汽車挖來了前圖森中國CTO王乃巖加盟。還有智駕行業人士告訴36氪,華爲智駕甚至通過相關專利來錨定人才,做定點挖掘。
新方案的確在引燃國內市場。但這枚硬幣另一面是,端到端強依賴於數據驅動,而非大量工程師的人力堆疊實現。特斯拉300人左右的團隊規模,被當成範本在頭部玩家之間傳播。
然而行業現實是,當下頭部玩家的智駕團隊,人才規模幾乎都是千人級。追趕智駕中的老牌車企比亞迪,有達3000人的軟件團隊,華爲智駕團隊人數也不遑多讓。行情好的時候,工程師們普遍能拿到年薪百萬的薪資包。
但不少智駕工程師都相信,如果端到端方案效果被進一步驗證,車企智駕團隊裁員將是大概率事件。
“200-300人都用不上。”一位前新勢力車企智駕骨幹堅定地對36氪說道。甚至深度學習背景的應屆生,可能都比一些智駕工程師進入端到端項目更有優勢。
一些智駕獵頭也明顯感受到了行業的人才滿溢:車企智駕團隊不再放出新崗位,人員開始要精簡,“很多掛着的HC都是殭屍崗。”在一位獵頭的最新動態中,他已經切換賽道,轉而替機器人公司招攬人才。
被堵在門外的工程師
智駕工程師田煒(化名)告訴36氪,這場新技術變革中,比起感知模塊、預測模塊,規劃控制模塊的工程師受到的衝擊會更大。
這主要因爲端到端方案與傳統智駕方案有明顯差異。傳統方案分爲感知、定位、地圖、預測、規劃控制等多個模塊,模塊功能實現基本由工程師的代碼驅動。感知、規劃控制兩大個部門的人員,往往佔智駕團隊人數大頭。
但端到端方案的特點是,從工程師的代碼驅動,變成了數據驅動。最理想的方式是,給系統輸入圖像,系統可以直接輸出車輛的控制,中間的環節都由AI神經網絡來完成。
從國內頭部玩家的進度來看,引入端到端方案後,傳統方案的多個模塊通過AI神經網絡改造,正在被整合成2個大網:感知大模型、預測決策大模型。“當下很多的方案都是在感知大模型的基礎之上,接入一個預測規劃大模型。”
更進一步的方案,會將感知預測決策規劃集於一體,行業稱之爲“One Model”(一個模型)。
而新的技術路線,也對車企智駕團隊有了全新的人才畫像。
有智駕人士告訴36氪,端到端團隊需要的人數變少,但人才門檻要求變得更高了。大模型本身要求團隊有很強的深度學習背景,“搭建方案階段,更需要很強的infra(基礎架構)人才,對感知、規劃控制每個模塊都有深刻認知,瞭解不同芯片算力平臺的支持力度、不同AI推理框架等。”
但負責模型搭建與訓練人只佔很小一部分。“可能團隊90%的人都是在爲端到端提供數據,以及數據閉環工具鏈支持等。”
“大模型本身就是一個很精幹的團隊。”有智駕人士說道。這也是OpenAI等AI科技公司早期僅有200-300人,但也能推出大語言模型ChatGPT,改變全球AI進程的原因。
對工程師而言,端到端技術帶來的衝擊也深淺不一。
有智駕人士告訴36氪,感知、規控兩大模塊中,感知大模型原本就依賴深度學習技術。儘管視覺檢測路線從過去的CNN卷積神經網轉向了基於Transformer的BEV,但工程師們的受到的影響並不大。
但對規控工程師而言,如果要加入端到端,幾乎是重新切換賽道。有智駕人士告訴36氪,傳統的規控工程師主要有幾個方向:路徑預測、路徑優化、規則後處理,以及車輛控制。“都是蠻細分的學科,基本不相關。除了路徑預測模塊之外,其他方向的工程師基本沒有深度學習背景。”
智駕工程師田煒告訴36氪,規控的人如果想轉端到端,一個方向是模型訓練本身,但需要很強的深度學習背景。“有可能研究深度學習的應屆生,對模型的理解都比你好。”
其次,是數據挖掘和處理,爲端到端提供數據養分。“但如果工具鏈的基建搭建完成,模型大概結構穩定之後,也可能不會再需要人。”最後是模型後處理,端到端大模型輸出的軌跡不可信,仍需要一小部分工程師要寫規則兜底。
工程師們的焦慮也來於此。“一方面是,端到端大模型本身不需要這麼多人。另一方面是,大家都想做端到端,但公司的量產業務需要有人運轉。”
一位智駕員工也因爲公司當前的量產項目,錯過了進入端到端項目組的時機而懊惱。但他也很糾結:即便進入端到端方案中,也是爲新的方案兜底,但這不是核心的大模型本身崗位;
而如果留在現在的量產項目崗位,可以積累一段完整的智駕量產項目經驗,未來幾年也還能流向傳統車企。
但另一種險境也會到來,一旦端到端方案向全行業普及,那麼他積累多年的技術棧在幾年後也會面臨淘汰的風險。“可能就要離開智駕行業。”
技術分野、資源遊戲
爲了轉入端到端項目組,工程師田煒直接從深度學習的研究生課程開始看起。
他找來深度學習的經典課程,以及一張顯卡,對着課本上的實戰課程,去實現一些簡單的圖像識別算法。“至少先把知識點吃透了,才能知道模型本身是怎麼運轉的。”
看書、實踐訓練兩個月後,田煒才稍微感覺自己能看懂一些端到端大模型開源代碼。 他已經向公司申請,調入端到端項目組。
事實上,不只田煒焦慮,田煒所在智駕公司比他更焦慮。他告訴36氪,其公司與一家車企合作開發智駕量產方案,但車企內部也有團隊在推進端到端,“整個公司就很焦慮,也早就啓動了端到端計劃。”
田煒表示,據公司瞭解,只要2000個小時的視頻數據,就可以訓出來一個端到端demo,而這個量級的數據用50輛車,跑一兩個月也能搞定。
但田煒很清楚,以公司現有的資源,最多也只能支撐訓練出來一個端到端demo,證明方案可行。從demo到量產,中間還有相當大差距。
而這場新技術的分野遊戲,會最先體現在資源分野上。
特斯拉CEO馬斯克就曾強調過數據對端到端的重要性:“用100萬個視頻case訓練,勉強夠用;200萬個,稍好一些;300萬個,就會感到Wow(驚歎);到了1000萬個,就變得難以置信了。”
另一方面是算力資源,馬斯克還大肆採購了英偉達的顯卡訓練,稱到年底其人工智能訓練算力將是9萬張英偉達H100的等效算力。算力的儲備與需求驚人。
這個門檻相當高。對於至今仍然賺錢艱難的智駕公司而言,一方面是不與車企合作,智駕公司的訓練數據很難光靠自身採集得到;另一方面,雲端的訓練芯片在國內一卡難求,不少車企都在高價收購。“量產項目與融資都還不明朗,很難長期投入端到端。”
而另一位智駕工程師也感受到了無奈。在開發端到端項目小半年後,他接到了公司的通知,暫停端到端項目。原因是公司要集中精力與資源去開發當前的城市無圖智駕方案,“端到端要消耗的資源太多了”。
該工程師感到可惜的是,他所在團隊做的端到端demo已經可以上路了。團隊最初還是奔着對標特斯拉的FSD而去,甚至還花了大力氣去搭建工具鏈等基礎設施建設。但隨着公司端到端戰略的暫停,團隊的研發重心已經轉向了機器人領域。
端到端新技術未在國內真正落地,但對智駕行業的人才結構重塑、生態格局的衝擊都已經開始顯現。
儘管如此,頭部玩家還是會想盡辦法擠上這趟具有顛覆性意義的快車,而掌握數據資源、芯片資源、人才資源的巨頭時代會到來。
(文中秦風、田煒均爲化名。)