對話袁進輝:必須實現Token自由,下一個“張小龍”纔會出現 | 涌現36人

文|鄧詠儀

編輯|蘇建勳

在國內大模型市場,大概沒有哪個人的經歷,會比2023年的袁進輝更具戲劇性。

“坐過山車的一年,”硅基流動CEO袁進輝總結道,“年初,OneFlow是估值1億美元的公司。被併購一個月後估值就超過10億美元。兩個月之後這個數字又變成零。再經過一個月成立硅基流動,又回到了起點。”

2023年,ChatGPT爆火之後,袁進輝創辦七年的一流科技OneFlow,瞬間成爲炙手可熱的項目。這源於前美團聯合創始人王慧文成立大模型公司“光年之外”,且迅速通過併購方式,邀請袁進輝作爲聯創加入。但數月後,光年之外因故被美團收購告一段落。

8月,袁進輝即宣佈創立新公司“硅基流動”,方向還在老本行:AI Infra(AI基礎設施)。

AI Infra相當於AI領域的“iOS”或“安卓”,上承算法和應用,下接硬件芯片。它的好壞與否,決定着下面的芯片層是否能將性能發揮到極致。AI Infra也是開發者們的“工具箱”,能幫助他們快速開發出AI模型和應用。

這個賽道是兵家必爭之地。AI框架是AI Infra的重要組成,是被大廠和芯片公司“上下夾擊”的一層——現在最廣泛的AI開源深度學習框架PyTorch和TensorFlow,分別由Meta和Google主導開發。

在袁進輝看來,Infra和芯片都是AI的底座的重要組成部分。選擇Infra方向,勝在走向市場的速度夠快。“芯片公司做一款芯片,都要兩年起步,遠水解不了近渴。”袁進輝向《智能涌現》解釋。

當下,正值AI大模型走向應用層的爆發時期,AI推理市場開始大規模增長。袁進輝的目標,就是在AI應用爆發之際,給開發者提供關鍵的“鏟子”。

6月,硅基流動剛剛推出新產品SiliconCloud,目前已達日均百億Token的調用量,團隊還宣佈多個主流模型服務永久免費——袁進輝也因此被許多開發者稱爲“賽博活佛”。

“必須擴大AI開發者的基數,讓他們實現Token自由,纔會有下一個“張小龍”的出現。”袁進輝說。

而縱觀袁進輝的兩次創業,都是關於證明自己、“捨我其誰”的故事。

七年前成立OneFlow,源於他看到的一個趨勢:AI模型體量將會越來越大,但已有的深度學習框架難以承載,需要全新的基礎設施。OneFlow成功打造出了世界前沿的分佈式深度學習訓練框架,不過當大模型突然成爲共識時,卻沒來得及跑通商業化閉環。

現在,面對全新的AI推理市場,袁進輝渴望完成這道證明題。

在上一個互聯網創業浪潮中,中國創業者往往被認爲擅長模仿,快速迭代出最經濟的商業模型。但袁進輝這樣的創業者,代表着一種新時代技術創業者的面貌——從第一天創業起,就敢於站在世界舞臺上,直面最前沿技術的競爭。

“AI框架就是一個贏者通吃的市場。無論我們面對大廠時多麼弱小,資源多麼匱乏,我們的雄心壯志,一直就是爲全世界做最好的產品。”他說。

8月,硅基流動正好成立滿一週年。《智能涌現》與袁進輝覆盤了過去他的心路歷程,以及聊了聊新出發後的風景。

以下爲對話實錄:

暴風眼中的一年

《智能涌現》:從去年8月份成立硅基流動,到現在也將近一年時間了。最近工作狀態怎麼樣?

袁進輝:這一兩個月我才緩過勁來,因爲去年一整年就像坐過山車。2023年的半年時間裡,我換了4家公司,從OneFlow,到光年之外,又到美團,然後8月份又分拆出來,就像大海風浪中的一隻小船。

到了2023年下半年,大模型方向的投資也冷靜下來。幸運的是,硅基流動成立以來順利完成了幾輪融資,資金上有了保障,現在產品推出後,還得到挺好的反饋,一定程度上緩了一口氣。

這一年AI行業的創業者,應該都有一種推背感。

《智能涌現》:2023年時,爲什麼會選擇和王慧文(原美團聯合創始人)合作,讓OneFlow被收購?當時其實王慧文去聊了非常多人,我們觀察到,大家想法態度也都很不一樣。

袁進輝:無論是科學家還是創業者,最本源是在追求做有Impact的事業。要做一件更大的事情,需要面對更復雜的局面、整合更多資源時,需要團隊,是不是我自己把握方向盤不重要,有這樣的ego是沒必要的。當時的狀況是,老王的產品、商業都是業內頂級,我們有技術、工程能力,其實是一個非常好的配置。

《智能涌現》:這段經歷給現在的創業,帶來了什麼?

袁進輝:非常獨特的一段經歷。與老王(王慧文)一起共事,在非常短的時間裡,學到非常多,共事的幾個月裡,很多事情我們幾個聯創會一起討論,能感受到他的思考和決策方式。我個人收穫最大的是商業、組織層面以終爲始的思考——以完成更大、更遠的追求和目標來倒推。

《智能涌現》:怎麼理解這個“很大、很高”的目標?

袁進輝:頂級企業家所表現出的作風,不給自己設限,永遠在迭代,永遠在進步。

他們不會從自己有多少資源開始,再決定要去做什麼事情,而是去首先思考世界、社會或者行業中最重要的問題是什麼?再看要通過什麼路徑來實現。

《智能涌現》:你覺得以前並不是“工具箱”不夠好,而是在於想得不夠大?

袁進輝:以前想得也大,不過沒有找到路徑。那幾個月正處在風暴眼中,迅速補完了很多課和Skill Set——這是打過仗才能獲得的體會。老王打過仗,就像創業課的博導。

《智能涌現》:哪些思考讓你最受益?

袁進輝:“先想清楚做什麼事,事情對了,資源都會有,包括人與錢。”

事後,這些話都得到了驗證。我們選擇再創業的時候,一個突出矛盾是,大模型那時仍是最令人激動的事,但我們沒有足夠資源了,我們怎麼纔能有機會繼續留在牌桌上,也要首先想清楚做什麼事。

《智能涌現》:我們在去年採訪老王的時候,聽到過一模一樣的話。

袁進輝:創業者要思考清楚那個特別客觀的東西,就像雷軍所說的“順勢而爲”裡的那個“勢”。這個可以是趨勢的“勢”,也可以是事業的“事”。

《智能涌現》:分拆的時候,有過哪些選擇?

袁進輝:選擇非常多,幾乎所有的大模型廠商都給我們拋橄欖枝了。還有很多大廠以非常誇張的薪資包裹來挖人,壓力非常大。

《智能涌現》:所以這些朋友的鼓勵,算是幫你消解了一些不確定性。

袁進輝:是的。整個環境趨冷的狀態下,所有投資人或靠譜人才都會更理性,他們首先考慮這件事是否靠譜,這是說服別人開槍的最關鍵的一點。

《智能涌現》:硅基流動現在做的是什麼事情,能用簡單易懂的語言來解釋下嗎?

袁進輝:我們的技術核心是提供一個推理引擎。要有效利用大模型,需要幾個關鍵要素:GPU、模型,以及讓模型在GPU上運行並具備問答能力的引擎。這個引擎的關鍵任務是確保模型運行穩定、不損失精度,並且運行速度儘可能快,運行速度直接影響到使用模型的成本。

在一定的算力基礎上,能夠快速生成更多的Token,成本效益就更高。

《智能涌現》:也就是像大模型界的“水電煤”,隨取隨用。

袁進輝:現在國內外大家都比較喜歡講MaaS這種產品形態,這實際上就是把模型、引擎、雲上的算力整合成一個API。

開發者不需要自己去找GPU或優化引擎。他們只需註冊,然後通過API調用模型並開發應用,按Token計費即可。大模型公司通常只提供自己的模型,但我們是一箇中立第三方,提供業內常用的開源模型,如通義、智譜、DeepSeek、零一萬物,以及海外的LLaMA、Mistral等。用戶可以根據自己的需求選擇最合適的模型。

《智能涌現》:你們以前做大模型的訓練框架,再創業後,轉向現在的推理框架。最後爲什麼還選擇繼續創業?

袁進輝:既有長遠的問題,也有眼前的問題。我們需要選擇一個很大的市場,另一方面,在達到最大的一個目標(AGI)之前,要保證我們在牌桌上,要生存下來。從這兩個角度出發,我們都應該轉去做推理。

《智能涌現》:這個市場有多大?

袁進輝:單純從算力消耗來說,很快推理會遠超訓練。做訓練方向的Infra,客戶集中度很高,而且,大模型訓練是階段性的需求,訓練數據通常是固定的,比如幾萬億、幾十萬億token的量級。但做推理,可能每天都是幾萬億到10萬億Token,一週就超過了訓練的計算量。而且,大家都認爲模型推理成本下降是超級應用爆發的前提條件之一。

《智能涌現》:現在模型的訓練和推理使用的算力,大概是在一個怎樣的比例?

袁進輝:前段時間英偉達有個財報電話會透露,按銷售出去的卡來算,訓練和推理比例已經不相上下。由於中國比海外的節奏會慢幾個月或者半年,所以國內可能訓練會多一些。

但現在也在發生一些變化,我相信你們也注意到,隨着開源模型水平上升,開源模型越來越多,已經能做出應用了。國內外行業的重心已經轉到應用,而不是再去卷模型訓練。我相信推理的算力已經超過訓練。

《智能涌現》:最近你們也新上了產品SiliconCloud,效果大概怎麼樣?

袁進輝:我們公測時沒有做任何的推廣,但每天涌進來很多新用戶,幾天後單日調用量就超過幾十億Token了。大家對這個數字可能沒有直觀的感受。ChatGPT的調用量都是萬億到數萬億Token/天,國內知名大模型一天的Token總量幾百億或幾千億,所以我們也挺受鼓舞。

《智能涌現》:比起原廠的模型,你們的優勢會在哪裡?

袁進輝:首先,模型種類非常全面,甚至包括一些很挑戰而稀缺的模型。像Deepseek 236B這樣的模型要部署好,其實有很多挑戰。目前爲止,除了我們和官方,沒有其他公司能將這些模型部署在自己的平臺上。而且,好多開發者發現,同樣的模型,在我們平臺上的推理速度更快。

模型降價,比想象中早

《智能涌現》:5月開始,模型廠商紛紛降價。降價潮,你覺得是提早來了嗎?

袁進輝:我們預計這個事一定會發生,但確實來得比想象早,比較突然,模型降價是Deepseek最早引爆的,其他各方主動也好,被動也好,都得跟進。

《智能涌現》:大家都是出於什麼心態在做降價這個事情?

袁進輝:大家態度不是很相同,但降價也是勢在必行。至少我們自己,用技術手段把成本真的做到了很低的水準,技術手段完全可以做到保證不虧本,甚至有錢賺。不過,業內絕大部分參與方還不是真正做到這一點,那就得補貼虧錢,非常有錢的廠商,可以這麼做。

《智能涌現》:這算是對你們有利的嗎?

袁進輝:是的,我們準備得足夠充分。

5月份,Deepseek發新產品的時候,我們也沒在第一時間推出來產品,兩三週之後我們的MaaS上線,我們計劃6月25號做推廣活動,結果正好趕上OpenAI宣佈對中國停服,我們就推出了部分大模型永久免費的活動。

《智能涌現》:我記得有一個報告提到,OpenAI在過去一年的推理成本下降了至少90%。無論是訓練還是推理兩邊,成本都下降得非常快。這個趨勢以後會怎麼演變?

袁進輝:毫不誇張。我在一個開發者大會上做過一個報告,標題是《讓模型部署成本降低1萬倍》。

《智能涌現》:1萬倍,怎麼做到?

袁進輝:多方面綜合發力。在芯片層面,有10倍的優化空間,最近有個很熱的新聞,一位00後創立了一個芯片公司,做了一款叫Sohu的芯片,號稱可以超過英偉達最新GPU10倍。模型層也有10倍。比如,現在100億參數的模型能力,超過一年前的千億參數模型。模型縮小了10倍,計算量也相應減少10倍。我們所在的基礎設施層面至少也有10倍的優化空間,一年前運行緩慢的模型,現在可以運行得非常快。

還有底層的雲計算,可以把算力部署在電費較低的地方,潮汐效應也有優化空間,白天服務一個區域,晚上服務另一個區域。綜合下來,相對於一年前的水平,10000倍是可以做到的。

《智能涌現》:如果把硬件和軟件分開來看,硬件的優化空間更大,還是軟件?

袁進輝:在大模型推理上,軟件的優化空間更大,這是由大模型推理本身計算負載的特點決定,它是訪存瓶頸的任務,主要優化機會是軟件層面的調度,不是芯片層面的問題。

《智能涌現》:如果軟件的優化空間更大,是否意味着,未來對大模型公司來說,芯片不再是問題了?

袁進輝:應該是,芯片供應商會變得更加多元化。未來應該會有更多的芯片競爭者,一旦競爭充分,芯片價格有很大的下降空間。之前有人做過粗略估計,一張H100的製造成本大約3000美元,但售價高達3萬美元,芯片成本有很大下降空間。

《智能涌現》:國內有不少創業公司出來做推理芯片,也想發展自己的軟件生態。大廠也在競爭,比如百度的AI框架“飛槳”已經做了很多年,同時大廠都是全棧式打法。你們所處的賽道,剛好是夾在芯片層和算法層之間,上下兩方都有可能侵蝕你們的賽道。

袁進輝:所有相關方都有競合關係。其它賽道的玩家站穩腳跟後,也可能會向我們發起衝鋒。

做推理方面的軟件優勢在於,能更快進入市場。芯片的開發週期長,即使現在開始做,也得兩年後才能出來。現在解決當前問題只能靠軟件。即使將來芯片出來,仍然需要軟件基礎設施。

《智能涌現》:所以這個事兒,相當於打個時間差的問題。在別人大規模做應用的情況下,我們能很快地進入這個市場。

袁進輝:是的。AI應用的基礎設施中有幾個環節,包括模型、芯片和軟件,這些環節相互合作才能給用戶帶來能力。所以我們都是互補的,誰也離不開誰。

如果模型層競爭非常充分,比如很多模型公司要和OpenAI競爭,這個環節供給多元化的話,其他環節就會活得更舒適一些。反過來,如果OpenAI的寶座坐得穩,它也會垂直整合其他環節。所以,模型、芯片、Infra都在競爭底座的生態位,即基礎設施的生態位。關鍵是誰先到達那個位置,或者誰能整合別人。

現在的模型,已經能支撐超級應用

《智能涌現》:我注意到你在朋友圈說,你覺得現在的模型能力已經足以支撐超級應用(Super APP)的出現,只是這樣的應用還沒有出現。爲什麼會有這樣的判斷?

袁進輝:大模型在三個方面的能力取得了突破。首先是語言能力,即模型說話是否流暢自然,大模型的語言能力甚至比大部分人都要好。

第二是知識能力。現在模型裡有了一些知識,雖然有一些所謂的幻覺,但有手段去解決,比如大語言模型+RAG。

第三是邏輯。目前邏輯推理還不是很強,這限制了模型在複雜場景中的應用,特別是Agent。

我想表達的是,前兩個能力在很多應用場景裡完全足夠做出驚豔的產品。

《智能涌現》:但無論是上下文長度或者幻覺問題,現在都還沒有解決得非常好。

袁進輝:上下文長度已經做得很好了,幻覺也有RAG等技術可以克服。

《智能涌現》:所以就差邏輯了。

袁進輝:是的。我相信,基於當前這些開源的模型,完全能做出新的Super App,當然,Super App還需要另外一些條件,我們需要等待。

《智能涌現》:我們首先來對齊定義,你覺得Super App的定義是什麼?

袁進輝:大家心裡會有個標杆,比如類似抖音、微信這種量級的,日活非常高,用戶離不開的產品。

《智能涌現》:這都是用戶數到10億級別的應用了。所以你是覺得,只是還沒有人做出這樣的創新而已?其實還有人說模型能力不夠——這是最近大家一直以來提到的一點。

袁進輝:我不相信模型能力還不夠這種說法。現在除了PMF,還開始講TPF(Technology Product Fit),其實產品上足夠有創意,不一定需要最尖端技術,介於GPT 3.5和GPT 4之間的開源模型對有的產品夠用了。

《智能涌現》:能舉個例子嗎?

袁進輝:比如陪伴對話,模型可以表現得非常自然。注意到最近美團推出的產品Wow,在海外上線後,有一位留學生使用它來解決生活中的煩惱。樓上的鄰居深夜開派對,影響她休息,但她不敢去交涉,Wow機器人一直給予她合理和理性的建議,就像一位朋友一樣。當她需要用英文與鄰居溝通時,Wow立刻轉換語言,幫她妥善處理了問題。

我認爲,這個場景需要的能力,開源模型都可以做到。

《智能涌現》:所以,開源模型和閉源模型的差距是在不斷縮小的?

袁進輝:開源模型追趕速度還是很快,這也說明最前沿的閉源模型的迭代速度變慢了。

《智能涌現》:參照雲計算的發展路徑,其實雲計算到現在已經是一個特別標準化的事情了,很早就陷入到同質化競爭。大模型的稀缺性能維持多久?

袁進輝:開源模型實現了讓模型觸手可及,現在不是那麼稀缺了。以後會不會稀缺,還要再走一段時間,看是不是會出現大模型廠商的收斂。

真正做到特別Top的模型非常少,或許有的模型廠商以後重心就會轉成應用了,甚至像朱嘯虎講的,幾年之後沒有所謂的模型公司,都是應用公司。

《智能涌現》:所以拼到後面,大家要拼什麼?

袁進輝:現在最容易想到的是錢和GPU,模型的技術傳播擴散還是很快的,以後很多公司都會模型技術,最後比拼模型之外的能力。最後都會反映到數據優勢上。比如現在騰訊出了元寶,基於微信生態的內容,元寶的效果就非常好。小紅書也很有優勢。

《智能涌現》:所以,你會更看好大廠做的AI應用嗎?

袁進輝:短期是大廠,長期我相信還有其他力量會起來。產品的創意和洞察具有偶然性。既然是偶然性,從概率角度來看,一個微小的概率,疊加一個巨大的基數,就很可觀了。今天的大廠裡做應用的人,加起來可能一兩千人,但他們之外,做應用的人可能是數百萬之衆。10年前,大家也不會想到有人能挑戰BAT,但總有新的公司出現。

《智能涌現》:從環境上來看,這跟上一個時代的創業一樣嗎?現在無論是錢、人才,可能都不太能相比。

袁進輝:AI也會有所謂的“傻瓜窗口期”,在一定階段內,可能都不會有多少人注意到他們。當年快手起來時,很多人對這個產品後知後覺,並沒注意到原來五環外還有這麼一個需求。

《智能涌現》:以後,國內有什麼方面能夠做到世界頂尖的水平嗎?

袁進輝:客觀來說,現在我們的芯片、模型,還不是世界頂尖。但在AI Infra領域,我很自信地說,我們肯定是世界頂尖,可以把國內外大廠的模型響應體驗、水準進行直接對比。在全世界都有競爭力,所以我們也在做出海。

《智能涌現》:框架層,還是大公司主導的領域,比如Facebook的PyTorch、百度的飛槳等,很講開源生態。中國公司想要出海,難度會在哪?

袁進輝:中國企業出海,開源是一個有效的手段,開源沒有國界,一些中國的開源項目在全球也產生了影響。

如果產品界面足夠清晰,足夠標準,容易嵌入已有的生態系統,只要能讓潛在用戶知道且低成本嘗試,就能和用戶建立聯繫。

例如,MaaS產品就是一個API調用,界面非常清晰,所有供應商都一樣,從一個地方遷移到另一個地方不需要任何改動。只要滿足大家最關心的基礎指標,如服務保障、響應速度、成本等,出海也相對容易。

《智能涌現》:現在,硅基流動的海外商業化進展怎麼樣?

袁進輝:我們的MaaS服務推出之前,軟件訂閱在海外就已經有10來個付費客戶了。

《智能涌現》:以後的重心會放在國內還是海外?

袁進輝:客觀來說,海外MaaS市場更大,國內海外並重。我們更熟悉在國內開發者社羣做產品和推廣,所以先從國內起步,海外產品也上線了。

《智能涌現》:關於商業化這件事情,有什麼東西是你現在堅持要做的?有什麼事就不做了?

袁進輝:關鍵的一點是,創業公司資源有限,必須找到一個非常好的點,深入挖掘,實現突破。切口可以小,但要切得深。無論這個點多小,都要在整個行業,甚至全球範圍內確立優勢。然後,將這種模式或方法論擴展到更廣泛的產品或方向上。

而不是一開始就什麼都做,但什麼都不精,這是很多公司遇到困難的原因。

《智能涌現》:這種轉變,跟現在的投資環境很有關係。

袁進輝:資金不是那麼充沛的情況下,也逼迫着每位創業者去思考,在更加節儉的狀況下做到引爆點。我覺得大家有一個共識,就是做強比做大更重要,更加健康。

《智能涌現》:你預計往後做的話,硅基流動還大概會需要多少錢,多少資源?

袁進輝:以現在的增長速度來看,我甚至衝動地覺得,不一定需要再融資,就能把生意轉起來,而且建立起比預期還要好的循環。當然,理性地看,還是應該拿到更多的資金,這樣做成功的概率更高,更有保障。

《智能涌現》:爲什麼現在就能實現了?

袁進輝:內外部條件都比較成熟。外部看,行業發展到了需要我們產品的階段,市場需求旺盛,而我們恰好處在正確的位置,一切都變成了我們的助力。

內部看,我們現在的技術水平,在同類產品裡也是世界上最能打的團隊。商業化方面最近也有頂尖高手加盟。

預測長期變得非常困難

《智能涌現》:這次新創業,目標有變化嗎?

袁進輝:和以前AI框架一樣,我們面對的是贏者通吃的市場,一旦決定做這件事,目標就是做成全世界都需要的產品。不管我們開頭多麼弱小,相對於大廠資源多麼匱乏,想的就是爲全世界做最好的東西,這一點沒有變。

《智能涌現》:跟當年創立一流科技的時候相比,你的心態有發生什麼變化嗎?

袁進輝:當年做OneFlow時還名不見經傳,當時做這樣的事情只有谷歌這種大廠,我們經常要說服別人,這事我們真的能幹好。現在不需要了,好玩的是現在實現了聲譽自由,很多人相信我們不僅能做,而且能做最好。現在追求的是更完整的成功,不光是技術有多厲害,還有產品、商業化、組織、文化等方面的成功。

《智能涌現》:什麼事變得更難了?

袁進輝:做OneFlow時,我們提前多年就預判了一個趨勢:大模型會出現,我們提前好幾年爲大模型做Infrastructure,而且很長時間內別人不信,只有我們相信,當時的窗口期非常之長,所以就很從容。

但現在,大模型就是明牌,節奏非常快,一天一個變化,想做非常長期的預測,變得非常困難。

《智能涌現》:五年之後,比如說你覺得哪些事情,但目前還是沒有辦法解決的?

袁進輝:有些能力也許根本不在大模型的能力範圍之內。大模型的價值觀是我們教給它的,它可能不會有真正的主觀追求和情感。

另外,語言模型之所以先爆發,是因爲自然語言有良好的數字化基礎,有大量的語料,但遷移到其他領域,譬如和真實世界的交互——具身智能等領域,歷史數據非常少,收集這些數據也面臨很多困難,我不知道這些問題在五年內能否解決。

《智能涌現》:過去一年,市場上有沒有一些共識的出現,是讓你覺得特別驚喜的?

袁進輝:大家普遍開始認爲應用非常非常重要,即使是OpenAI現在也開始親自上陣或以併購的方式爲應用產品做準備。

《智能涌現》:有沒有一些你自己之前非常堅定相信的東西,在這一年裡會發生一些變化?

袁進輝:一年前我高估了大模型的難度,沒有預料到其他玩家追上OpenAI的速度這麼快。應該有不少人和我一樣想錯了。去年上半年,絕大多數人還在猜測誰能搞出GPT-3.5,現在是家常便飯了,現在普遍要追上GPT-4.0,甚至Claude都已經開始超過4.0。