小鵬智駕李力耘:我們處於無人化前夜,智駕Scaling Law還有很大紅利|36氪專訪

文丨李安琪

編輯丨李勤

從美國試駕完特斯拉FSD回來,小鵬智能駕駛負責人李力耘有兩大感受。其一是,特斯拉FSD在北美地區的確是獨一檔,但他也意識到,需要對特斯拉祛魅。

“中美路況非常不一樣,我們更懂中國路況,更懂國人的駕駛習慣,特斯拉可能更懂美國人的駕駛習慣,很難說誰更強。”李力耘說。

角逐和較量在智駕圈裡已經不新鮮。過去一年裡,小鵬等車企迅速捲入了“全國都能開”“端到端”的智能駕駛競爭。

在今年12月末,小鵬還計劃交付“車位到車位”智駕駕駛功能,技術模型也升級爲“一段式端到端”,可實現全場景覆蓋,包括園區低速行駛,未來會覆蓋泊車、高速場景,甚至海外智駕。

“車位到車位”是當下車企智能駕駛競爭的技術高地。如字面含義,車企希望用戶在車位就能啓動智駕,車輛低速巡航、自主過閘機、上高速,在城市道路通行,最後泊入目的車位。

12月初,特斯拉向部分測試用戶推送的特斯拉FSD v13.2更新版本,就包含了從停車狀態啓動的FSD,也就是“車位到車位”功能。前不久理想汽車也宣佈突出該功能,華爲和小米汽車的類似功能,同樣即將推出。

智能駕駛走向自動駕駛的過程不是一蹴而就,而是車企們通過技術攻堅,不斷完成高速、城區、泊車、園區等場景拼圖。如今,這一步即將完成。

李力耘也表示,現在小鵬處於“無人化(駕駛)前夜”,明年在能力上會有更大突破,“可能先在Max車型上,小鵬智駕逐步提供類似無人駕駛的能力。”

這幾乎是最早給出無人駕駛節點的國內車企。

小鵬的確是國內最早貼上“智駕”標籤的車企之一。2019年,小鵬就在轎跑車型P7上開發了高速NGP功能,對標特斯拉NOA。

但因爲起步早,小鵬幾乎走過所有技術路線,從依賴高精地圖,轉向無圖方案,隨後進化到端到端。2023年8月,小鵬智駕還經歷了靈魂人物吳新宙離職、團隊動盪等。小鵬智駕由此進入守城階段。

同一時期,行業有玩家迅速進入了高階智駕量產狀態。比如壓強式投入的華爲,率先推出了“全國都能開”智駕功能;理想汽車則由於輕包袱,果斷切入“端到端”技術,甚至直接更換到激進的“一段式端到端”方案。

從今年中以來,小鵬智駕試圖迴歸與反擊。

近日,小鵬智駕負責人李力耘接受了36氪的採訪,他分享了小鵬如何將AI融入智駕,以及標配純視覺智駕後,如何實現科技平權與商業閉環。

李力耘告訴36氪,小鵬對於端到端的研發始於2023年4月,當時主要是想用AI的認路能力,擺脫對高精地圖的依賴。

結果小鵬發現,“一段式端到端”大模型上線之後,原來需要花很長時間打磨的場景,如特殊分流、右轉或掉頭等問題,很快就被解決了。

今年5月,小鵬正式推出“端到端”智駕大模型,包含神經網絡XNet、規控大模型XPlanner、大語言模型XBrain三大部分。

端到端智駕依賴的核心資源之一就是數據,小鵬宣稱,其端到端大模型訓練數據量已經達到2000萬clips。理想汽車也公開過其端到端的訓練數據,目前大約在800萬clips。

對於2000萬clips的數據起點,李力耘告訴36氪,這得益於過去基於規則的智駕經驗積累,小鵬當前的數據採集和訓練效率很高,例如通過車端規則經驗實時標註,精準採集訓練所需片段,從而針對目標場景進行精準密集訓練。

他同時認爲,在海量數據、不斷提升的雲端和車端算力下,自動駕駛的Scaling Law還有很大紅利。

Scaling Law是大模型行業的一個定律,通常表示模型參數越大、數據集越大和計算資源增多,模型性能更好。

小鵬推出“端到端”大模型智駕方案的標誌性成果,就是更果斷擺脫對激光雷達的依賴,將純視覺作爲智駕技術路線。例如在新車P7+上,小鵬就標配了純視覺智駕AI鷹眼方案。

但在行業中,未來數年的主流選擇還是以視覺+激光雷達作爲主要傳感器。對此,李力耘向36氪汽車表示,走純視覺路線其實是出於第一性原理。

在他看來,人們生活的交通環境,包括路牌、路標、紅綠燈,整個道路甚至車的造型都是爲人設計的,“人最重要的傳感器是眼睛,所以純視覺一定是最直接、最高效的解決方案。”

小鵬也宣稱,其基於AI鷹眼的純視覺方案,能做到比人眼視覺更好的效果,可以很好應對大光差、逆光場景。

在純視覺智駕之路上,小鵬汽車決定走到底,李力耘告訴36氪,從P7+車型開始,不再有Max和Pro的版本區分,而是“全系標配Max,也就是小鵬 AI 圖靈智駕(NGP),都會用純視覺方案。”

這背後蘊含着一套清晰的智駕商業化策略,“我們會用一段式端到端放大我們的車型優勢,不僅標配所有車型,更希望覆蓋所有功能,實現點到點,包括賦能海外的智駕。”純視覺智駕方案,無疑在成本上擁有先天優勢。

實際上,憑藉在同級車型中做出“智能差異化”的賽馬策略,小鵬已經在兩款新車 MONA M03和P7+上,嚐到了甜頭。

M03自9月上市以來連續3個月銷量破萬,P7+上市3小時也獲得了超3萬大定。這兩款車的售價都在20萬元以下,這個價格帶是比亞迪等老牌車企的優勢領域。

“智駕是小鵬P7+用戶購車的 top 理由。”李力耘說,當下熱銷款M03的泊車體驗也與Max版智駕同級。

智能駕駛技術在車企的商業體系裡已經越嵌越深,同時,也在承接整個AI技術的發展紅利,快速迭代。這是資源和效率交織的產物。

李力耘說,如果把端到端的技術趨勢看作智能駕駛駕領域的一場“工業革命”,能真正實現轉型升級的企業其實是少數,大部分人還是會面臨更殘酷的競爭。

因爲,端到端不是讓事情變得更簡單,而是讓整個迭代鏈條變得更長,更加不可控,某種程度上需要投入更多的資源,包括更大算力,更加精英的AI研究人員。

“我更願意相信是車企,而不是供應商,能夠率先從輔助駕駛突破到無人駕駛。”

以下是36氪汽車與小鵬智駕負責人李力耘的對話,內容略經編輯:

談體驗:“車位到車位”之爭,用戶會爲更好的體驗買單

36氪汽車:聽說你剛從美國回來,有體驗特斯拉的FSD v13嗎?

李力耘:但很遺憾,因爲v13還沒有量產推給用戶,我沒機會試FSD v13,但開了一個星期v12.5。有兩點可以總結,第一是祛魅,第二特斯拉在北美是獨一檔的存在,很多值得學習的地方,包括停車場激活、開進停車場,這些是用戶非常喜歡的功能。

去魅的話,我覺得中美路況非常不一樣,無論是我們XNGP 5.4.0還是即將發佈的5.5.0 版本,智駕都和特斯拉不相伯仲。我們更懂中國路況,更懂國人的駕駛習慣,特斯拉可能更懂美國人的駕駛習慣,很難說誰更強,我非常期待FSD進入中國之後的表現。

36氪汽車:行業會說特斯拉技術領先國內半年到一年,您覺得這種技術領先現在還有多少?

李力耘:從技術方法論上,小鵬和特斯拉、OpenAI 這樣的全球AI企業不謀而合,我們強調雲端大模型,參數量是車端80倍以上。我們雲端大模型的訓練數據量達到2000 萬以上clips。每個clips可以理解成大約一分鐘的小電影。每個模型都基於大量數據、在雲端訓練。我們有個說法叫“雲上一天,地上三五年”。

我們希望把雲端能力通過蒸餾下放到不同芯片平臺,甚至未來換芯片後也能把雲端模型下放。

36氪汽車:您覺得特斯拉FSD v13上的“車位到車位”跟國內的“車位到車位”有區別嗎?

李力耘:我們即將推給用戶的XOS 5.5.0版本上,用“一段式端到端”給用戶提供了一個完整的“車位到車位”體驗。其實在停車場和地庫,2021 年我們就推出了VPA(記憶泊車)功能,但用戶體驗並不好,用戶滲透率沒有城區智駕那麼高。

所以,我們用“一段式端到端”實現所有車型標配後,現在去實現全場景覆蓋,包括“車位到車位”低速行駛、園區行駛,未來還會覆蓋泊車、高速,甚至海外智駕。我們希望給用戶帶來更加連貫、絲滑的體驗,而不是有割裂感、類似於VPA+NOA的組合體驗。

36氪汽車:用戶第一次開到新的地庫,需要先記憶一遍才能實現點到點嗎?

李力耘:第一次肯定沒有地圖,很難,如果有園區內導航指引會好一些。就像你第一次去一個地庫,也需要一些指引或者藉助他人的記憶,我們可以做到無感學習和記憶。第二次去就可以有絲滑的“車位到車位”能力。

36氪汽車:小鵬之前也有記憶行車,比如記憶10條路線,這跟“車位到車位”的本質區別是什麼?

李力耘:最大區別還是體驗層面。小鵬智駕在2024年最大的兩個變化,第一是 AI化,面向AI進行組織變革,進行AI能力提升,另一個變化是,我們覺得用戶不會爲更好的科技買單,但一定會爲更好的體驗買單。

用端到端大模型賦能“車位到車位”後,用戶體驗會大大提升,雖然有時候可能需要學習、參考先驗信息,但學習感會很弱。

談AI:智駕Scaling Law還沒到盡頭

36氪汽車:今年智駕行業變化很大,年初卷“全國都能開”,後來變成端到端,現在是“車位到車位”,您怎麼看這種競爭?明年的競爭重點是什麼?

李力耘:原來小鵬智駕是孤勇者,現在是百舸爭流,明年的競爭一定會更加激烈和有趣。

今年從“全國能開”逐步走向端到端,比拼的是博弈能力、比拼擬人化。到“車位到車位”之後,我覺得我們處在“無人化的前夜”階段,小鵬智駕會篤定地走向無人駕駛。

我們希望,明年在能力上有所突破,可能先在Max車型上,小鵬智駕逐步提供類似無人駕駛的能力,接管次數無限降低。隨着法規推進,或者新車型推出,我們一定會做出走向無人化的能力。小鵬的最終目標是解放駕駛員的雙手、解放精力。

36氪汽車:怎麼做到?Scaling Law在智駕領域有效嗎?

李力耘:小鵬是Scaling Law的忠實信徒。雖然最近很多AI前沿工作說Scaling Law、預訓練遇到了瓶頸。但從算力、數據量來看,我覺得自動駕駛的Scaling Law還有很大紅利。

數據方面,互聯網優質數據大概600-700T之後就會有瓶頸。但智駕大部分企業今年才逐步轉向端到端,自動駕駛大量優質駕駛數據積累還沒有到盡頭。

另外,無論車端還是雲端算力,都會有着更顯著的增長,模型參數也會進一步擴大。我覺得自動駕駛的Scaling Law還沒有到盡頭。

36氪汽車:行業會有些做法,比如將端到端大模型跟視覺語言模型融合,您認同這種觀點嗎?

李力耘:我不反對。這些觀點在以不同的視角來描述端到端,在我看來可能殊途同歸。無論是視覺語言大模型,還是視覺動作大模型,本質是通過大量數據輸入,有一定推理能力,很好地實現類人駕駛的模型。

小鵬以視覺爲主,我們實現了“光子進、控制出”。當然,從多模態輸入角度來看,視覺只是一個傳感器,本身還有各種車道、GPS或者是各種各樣多模態輸入。

網上的海量數據會讓模型有更強的認知能力,識字認路。但是我們認爲,擁有高質量的、豐富駕駛數據可以更好解決車輛駕駛的小腦問題,這跟大模型不衝突。

很多駕駛是相對本能的動作,就像人類的小腦,當然也需要大腦的能力。所以在我們的一段式端到端大模型中,Xbrian可以認路識字,做一些簡單推理,但更多時候還是對加減速控制、變道時機選擇,或者繞行處理,更偏本能的小腦行爲。

我們是既希望有聰明的大腦,能夠推理思考,還是一個比較靈敏的、肌肉記憶很好的老司機。

36氪汽車:小鵬是從什麼時候開始做端到端大模型?

李力耘:2023年4月份,我們開始佈局整個“端到端”技術棧。那時候我們希望用端到端來解決對高精地圖的依賴問題,做到全國都能開,所以當時智駕AI化,更注重識路、找路。2023年底,我們意識到需要把端到端的能力進一步擴大,做成一段式端到端。

36氪汽車:2023年4月您和團隊當時是怎樣的狀態?

李力耘:當時主要在開城,狀態很難,因爲把高精地圖的柺杖扔掉之後,嘗試用實時算法去認全國各種各樣的路況,並且讓車能夠配合好行駛,是非常困難的。唯一能夠徹底解決這件事就是靠AI,用類人的方法把路認好、把路選好,讓車開好。

36氪汽車:那時候就定下了整個端到端、AI模型的框架嗎?

李力耘:方向是篤定的,但我覺得技術變化會非常快。今年以來,我們也看到了類似於Sora、ChatGPT非常強的AI能力涌現。我們也升級了AI的戰略,包括對雲端模型Scaling Law的認知,緊跟AI最前沿,然後應用在自動駕駛領域。

36氪汽車:小鵬智駕起步非常早,經歷了很多個版本,在端到端進化這條路上你們甩掉了哪些包袱?

李力耘:端到端模型的建立是個非常緩慢的過程。系統工作方式從原來多技術模塊變成AI中臺。我們會着重建設數據採集能力、數據清洗,模型快速訓練、部署、調試,確保模型高效解決問題。

規則還是很重要的兜底能力,一方面是爲安全兜底,第二,原來規則積累的工程基礎,可以讓我們把整個數據閉環、飛輪非常高效地建立起來。

36氪汽車:從2023年到現在,如果要選取比較重大的轉折點,您覺得會是什麼時刻?

李力耘:重大轉折是今年四五月,小鵬一段式端到端大模型上線之後,我們發現,原來需要花很長時間打磨的一些問題,比如花幾個月去打磨一些特殊的分流、右轉或者是掉頭等場景,解決得特別快,我們很驚訝。

原來的方案是小模塊AI驅動,然後做路徑規劃、速度規劃,整個鏈條非常長,遇到的問題很多。但我們用了AI能力後,環島掉頭、小路、很難的右轉場景都有很大的能力提升,效率比原來高很多。

36氪汽車:華爲沒有把純視覺當成主流方案,小鵬爲什麼會這麼堅決地要做純視覺?

李力耘:其實就是第一性原理。我們生活的交通環境,包括路牌、路標、紅綠燈,整個道路甚至車的造型都是爲人來設計的,人最重要的傳感器是眼睛,所以純視覺一定是最直接、最高效的解決方案。特斯拉也分享過觀點,認爲激光雷達+純視覺1+1並不大於或等於2,而是小於2。

小鵬的AI鷹眼視覺做到了比人的視覺更好的效果。在很多大光差、逆光的情況下會比人眼有更好的識別效果,這也是我們LOFIC架構的特點。當然我們也沒有放棄主動的傳感器,也會通過多模態跟毫米波雷達,超聲波雷達去做融合。

36氪汽車:在高速道路上或者一些特殊天氣,激光雷達還是有很好感知效果,小鵬純視覺有沒有解決這種特殊天氣場景下的方案?

李力耘:我恰恰覺得,這些情況下,第一性原理是更好的。再好的激光雷達在遠處的點雲也是比較稀疏的。激光雷達不是完美的,在一些雨水天氣情況下它也有問題。小鵬AI 鷹眼視覺是通過更大算力,看得更清楚、更遠、反應更快,車輛反應速度提升了百分之四十幾,對場景做出很好的響應。

36氪汽車:後續像在 X9 這些車型上,還是會保留激光雷達和純視覺兩種不同的方案嗎?

李力耘:我們會全系標配Max,也就是小鵬 AI 圖靈智駕(NGP),都會用純視覺方案。

36氪汽車:那方案配置方面,還會分Max 、Pro 嗎?

李力耘:我們會標配Max,從P7+開始。

36氪汽車:小鵬自研的智駕芯片,結合你們的軟件方案後,可以發揮出什麼樣的效果?

李力耘:小鵬自研芯片的初衷就是實現軟硬件一體,最大效能地發揮軟件的威力。但更重要的是在雲端模型的賦能下,我們會對芯片做針對性優化,給用戶提供最好的體驗。

36氪汽車:小鵬智駕下一個轉折點會是什麼時候?

李力耘:2025年小鵬智駕轉折點會在年中,智駕能力會有更大飛躍,可能會從一段式端到端,跨越到全新的 AI 迭代模式。

36氪汽車:智駕行業密集迭代,公司創始人何小鵬怎麼保持對智駕前沿的認知?

李力耘:小鵬智駕真正的一號位和靈魂就是何小鵬。因爲他篤定AI,篤定智能駕駛到自動駕駛,纔有小鵬智駕的自我變革。他非常從用戶視角來看智駕,會去開智駕的中間過程版本和量產版本,感受變化,反饋問題。

所以對行業態勢的感知一定是多模態的。現在我們特別注重用戶反饋的NPS,智駕每個版本都會去做用戶調研。當然也會和頂尖AI企業保持緊密接觸,包括去美國開車、取經等,兼聽則明。

36氪汽車:何小鵬上一次給你反饋智駕問題是什麼時候?

李力耘:不久前,我們把XOS 5.5.0 過程版也推給了他,他覺得我們又解決了30%-40%的問題。

36氪汽車:端到端方案依賴海量數據,小鵬達成了2000萬clips的訓練數據,在這方面小鵬有沒有什麼心得?

李力耘:得益於兩方面,一方面是AI智駕鐵軍,車端積累多年的規則和嚴謹算法,很多事情在車端做是事半功倍的。

另一方面,得益於小鵬AI的進展,我們需要大量、高效敏捷地去挖掘數據,訓練模型。所以我們既做車端模型、雲端模型,也做了非常好的AI工具來挖掘數據。

這背後是組織方式的改變,我們有個AI效能部門,今年年中面向AI成立的新部門,專門訓練各種各樣的AI提效工具,包括用AI寫代碼、檢查代碼、自動挖掘數據。

36氪汽車:小鵬智駕2000萬clips的數據是如何達成的?

李力耘:我們大約在2022年底,就開始預研如何引入AI大模型,已經有了幾年的積累。而且我們地把規則時代積累的經驗移植到當前的數據採集和訓練裡,例如通過車端規則經驗實時標註,精準採集訓練所需片段,從而針對目標場景進行精準密集訓練,能夠大幅地提升採集和訓練效率。

「談競爭:智駕工業革命,轉型成功的是少數」

36氪汽車:友商通過端到端快速實現了高階智駕量產。端到端會是行業其他人彎道超車的方案嗎?

李力耘:如果把端到端技術趨勢看作智駕領域的一場“工業革命”,每一次工業革命中,真正實現轉型升級是少數,大部分人還是面臨更殘酷的競爭。

端到端不是讓事情變得更簡單了,組織架構的確跟原來不一樣,原來每個技術模塊都要基於規則的工程師,比如定感知、定位、規劃、融合、地圖、控制,現在就變成了數據閉環的問題。

數據採集、模型訓練、模型部署,模型調試,它讓整個迭代鏈條變得更長,更加不可控,某種程度上需要投入更多的資源,包括更大算力,更加精英的AI的研究人員。

36氪汽車:智駕供應商跟傳統車企如果保持比較深度的綁定,能繼續參與這場遊戲嗎?

李力耘:第一,智駕真正從輔助駕駛走到無人駕駛一定是滿足第一性原理的。我更願意相信是主機廠,而不是供應商,能夠率先從輔助駕駛突破到無人駕駛。

第二,主機廠在軟硬件方面的配合、數據和中後臺的配合,可能是事半功倍;對非主機廠而言,可能更不容易,數據背後的閉環是更隱形的挑戰。

36氪汽車:小鵬智駕成爲標配,要從哪些角度去評估智駕技術的商業價值?會有指標嗎?

李力耘:現在智駕就像當年的手機行業,我們一定要把智駕價格打下來,未來的車型都會標配高階智駕。其實,智駕是小鵬P7+用戶購車的 top 理由。我們不會用智駕能力再做二次收費。

在小鵬X9 上,73%的車主都選擇了Max車型。我們也會持續關注用戶對智駕的反饋,比如他們喜歡的一些亮點或者不喜歡的槽點;在標配智駕後,我們會看用戶的滲透率,比如在能開智駕的地方,用戶是不是都開。

36氪汽車:市場上會有觀點說,小鵬現在車賣得好不是靠智駕,比如MONA M03。您會反駁這種觀點嗎?

李力耘:在MONA M03,智駕也起到了很重要的作用。同樣價位上,小鵬MONA M03 的智駕仍然領先,比如MONA M03率先推出斷頭路泊車,體驗上和主銷車型Max版泊車能力一樣。春節之後,MONA M03的 Max版本也會上AI鷹眼視覺方案,實現高階智駕的普惠跟平權。

36氪汽車:CEO何小鵬對明年的智駕提出了哪些考覈和要求?

李力耘:我們希望2025年,在擬人感、安全感、舒適和效率上,做到更不一樣的臺階和層次,與行業明顯拉開代際差距。

更重要的是,我們會用一段式端到端放大我們的車型優勢,不僅標配所有車型,更希望覆蓋所有功能,實現點到點,包括賦能海外的智駕。

36氪汽車:海外市場智駕會是你們明年發力的重點嗎?

李力耘:對,小鵬非常堅定國際化,未來10年海外銷量要佔全部銷量一半。2024年小鵬的出海非常不錯,但我覺得智駕還可以更好。明年,小鵬會根據海外當地的駕駛習慣和法規,把智駕體驗按照當地用戶喜歡的方向去做,提供給當地用戶。

36氪汽車:除小鵬本身之外,智駕團隊還要支持別的項目嗎,比如參與大衆的項目?

李力耘:我們一直跟大衆配合很好,無論是在車型上,還是電子電氣架構上,或者智駕上,雙方都是緊密合作。智駕會有專門的虛擬團隊和項目組去跟進,和大衆合作的車型會很快和大家見面。

36氪汽車:在大衆項目之後,小鵬的智駕還會有單獨商業化的可能嗎?

李力耘:小鵬是非常篤定地把輔助駕駛推向極致,走向無人駕駛的。在AI輔助駕駛的理念下,我們會更看重像AI鷹眼視覺帶來的智能駕駛體驗平權。至於真正的商業化,可以關注小鵬在2026年無人駕駛的進展。

36氪汽車:你們會對 L3 有更多探索嗎?還是會直接進入到L4?哪個更快?

李力耘:我們一定會推進 L3 和 L4。哪個更快,這個取決於法規進展,我們一定緊跟着法規進展。在明年的Q1、Q2某個時候,隨着我們體驗和能力更進一步的提升,大家會看到更多可能。