晚點對話 MiniMax 閆俊傑:創業沒有天選之子

文丨程曼祺編輯丨宋瑋

經過 “一切在加速” 的 2024 年,圍繞中國大模型創業的討論,從 “誰又融資了?” 變成 “誰會第一個倒下?”

行業分化時刻,我們與中國大模型六小龍之一,估值已超 30 億美元的 MiniMax 創始人兼 CEO 閆俊傑訪談 3 小時,聊了 MiniMax 的新技術目標、新模型,去年一年的公司變化和人員調整,和他作爲一個 “練習時長 3 年” 的初次 CEO 的自我覆盤。我們也對他進行了 “信仰之問”。

10 個月前,閆俊傑也接受過《晚點》訪談,那時他提了 16 次字節、47 次 OpenAI,8 次 Anthropic。

這次再聊,他主動提字節少了,提 Anthropic 多了。這與行業風向形成微妙的反差。

閆俊傑更在意字節的 2024 年 3 月,中國大模型創業公司勢頭正盛,此前 6 個月裡,各模型公司至少融了 20 億美元。

而現在,重金投入 AI 的科技大公司力壓一批明星創業公司,MiniMax 本來看起來相對 “安全”:它的 AI 社區產品 “星野”,其用戶數、使用時長和留存率都高於字節旗下的同類產品。

閆俊傑卻自己推翻了這些優勢,在他現在的認知裡,用戶數等指標並非 AI 競爭的核心:

“推薦” 的邏輯是:用戶越多,反饋越多,推薦引擎越聰明。而閆俊傑認爲,AI 大模型和產品的真實關係是:

在更明確 “智能水平的提升,沒那麼依賴很多用戶” 後,閆俊傑說他做出了取捨,結束了整整半年多的焦慮。他說,現在 MiniMax 最重要的目標不是增長,也不是收入,是 “加速技術迭代”。

1 月 15 日 MiniMax 發佈的首個開源模型——MiniMax-01 系列,也是這個目標的結果之一。

MiniMax-01 首次在 4000 億以上參數的大模型中,使用了線性注意力機制新架構(標準 Transformer 是非線性注意力機制),能高效處理全球最長的 400 萬 token 上下文。

閆俊傑認爲 long-context(長上下文)是 Agent(智能體)的重要能力,它能增強 AI 的 “記憶”。提升單 Agent 交互質量和多 Agent 之間的通訊能力。

閆俊傑覆盤了認知尚不足夠清晰時的一些失誤:

說自己不再焦慮的閆俊傑,做了一些與衆不同的技術選擇:這次 MiniMax-01 使用的線性注意力機制,不是一個強共識方向;而在最熱門的 OpenAI o 系列模型方向上,MiniMax 沒有第一批跟進。

他的表達風格也比 10 個月前犀利了:

1989 年出生的閆俊傑,年輕,但非 90 後;是人工智能博士,但不是歐美海歸;他不是業界大佬,也不是 “技術天才”。“大部分做技術的人會覺得自己很牛,是天才。但我不是這麼認識這個世界的。”

閆俊傑說,去年他反思最多的事是:爲什麼自己的認知不能提升更快?他找到的新方法是:放下 ego(自我),思考更深。

“如果可以重新選,應該第一天就開源”

晚點:你們發佈 MiniMax-01 系列新模型後,得到了什麼有意思的反饋?

閆俊傑:技術人員比較關注的是,第一次有一個很大的模型沒有完全用傳統的 Transformer 架構,架構層也可以創新。

而一些非算法的合作伙伴和朋友說,覺得我們好像有點上道了,開始意識到要做技術品牌了,合作起來也少了不開源導致的各種限制。

晚點:那你們真的上道了嗎?

閆俊傑:這是我們第一個開源系列模型,本質上兩個原因:第一是我們認爲真正有價值的事,不是當前做得怎麼樣,而是技術進化速度。而開源會加速技術進化,做得好的地方有鼓勵,不好的地方會有很多批評,外面的人也會有貢獻,這是我們開源的最大驅動力。

第二是,過去兩三年,我們做得特別不好的一件事兒是,對技術品牌沒有很深的認知。技術品牌之所以重要,本質也是因爲這個行業最大的驅動力是技術進化。這需要算力、數據、錢,也需要足夠好的人。

晚點:DeepSeek-V3 在全球技術社區爆火,是不是刺激你們了?此前在 Hacker News 上搜 DeepSeek,有 470 多個帖子,而搜 MiniMax 很少。

閆俊傑:我們意識到要做技術品牌時,DeepSeek-V3 還沒有發佈。

我和樑文鋒 2023 年初認識後,他有兩件事對我有啓發:一是他們的品牌做得非常好,它的信譽和口碑是量化行業最好的之一。另一個啓發是,DeepSeek 一開始沒有產品,所以更聚焦。

晚點:爲什麼沒有更早開源?

閆俊傑:第一次創業,很多經驗不具備。如果可以重新選,應該第一天就開源。

如果我是 OpenAI,我今天都應該開源,因爲它的核心能力已經不是模型比 Claude 或 Gemini 好多少,而是 ChatGPT 的品牌與心智。

我們這次開源,也不會自己藏一個更好的東西,這沒有意義,所有模型一年之後都會落後。我們的通用模型也會持續開源。

晚點:MiniMax 成立之初就是同時要做模型和產品。而 DeepSeek 樑文鋒曾說現階段不做產品,只做模型,你怎麼看這個策略?

閆俊傑:首先,DeepSeek 最近也有 App 了。

但反過來說,我覺得中國人工智能產業過去一兩年一直有個巨大的誤區:就是認爲用戶越多,模型能力提升越快。這個邏輯非常錯。

你看 ChatGPT 的 DAU 是 Claude 的 50 倍到 100 倍,但它的模型並沒有好 50 倍,二者其實差不多。這就反映,智能水平的提升,其實沒那麼依賴要有很多用戶。

晚點:不是用戶越多,模型能力就提升越快——去年這個觀點幾乎沒人信。

閆俊傑:這個事要分兩層看:

一是模型是產品出現的驅動力。比如去年有很多視頻產品,這是因爲有了更強的視頻模型。

但模型卻不是基於用戶反饋和數據迭代才變好的。Claude 3.5 Sonnet 的代碼能力很好或市面上的視頻模型很強,不是因爲之前已經有了很大的編程或視頻 AI 產品,而是先定了一個技術 benchmark,才做到的。

所以,更好的模型可以導向更好的應用,但更好的應用和更多用戶並不會導向更好的模型。

這個現象的底層原理是,在日常使用中,模型比大部分用戶更聰明,大部分用戶的 query(查詢)其實沒有模型自己模擬得好。

晚點:這個誤區讓整個行業走了什麼彎路?

閆俊傑:爲了有更多用戶,就花大量的錢來買流量。更核心的是,中國大部分公司,不管創業公司還是大廠,都還在用做推薦系統的方法來做大模型產品。

比如一個內容產品,你沒法明確知道什麼會火,所以就要大量做 AB Test,這是高效的。但這個邏輯到了模型裡,就變成不同研究員去嘗試不同算法,在不同 feature(功能)上做不同實驗,不行的話再累加。這不是做 AGI 的方式。

晚點:什麼纔是纔是更合適的方式?

閆俊傑:應該非常清晰地定義模型能力分級,然後搞清楚每一代提升,需要什麼樣的算法、數據和推理過程,通過技術手段來逼近定義好的指標。

晚點:你什麼時候有了這個認知的?這和你們這次更新的關係是什麼?

閆俊傑:去年 3、4 月。 我們想清楚之後,就幹了幾件事兒。

第一是,技術和產品要分開,技術就是要不斷提升上限,這需要定義好下一代能力。比如爲什麼這次用了全新架構,本質是因爲我們認爲 long context(長上下文)很重要。

第二是,不要認爲有產品之後模型就會變好,產品的目的不是讓模型變好,它就是一個商業化產品。真正需要思考的是怎麼更好滿足用戶。

晚點:那麼對你們來說,到底是技術更重要還是產品更重要?MiniMax 是一家技術驅動的公司,還是產品驅動的公司?

閆俊傑:我們非常明確,自己是一家技術驅動的公司。它不是一個口號,實質是,當遇到衝突時誰說了算?

晚點:可以舉一個技術說了算的例子嗎?

閆俊傑:比如海螺視頻,按月訪問量,現在是全球最大的視頻生成產品了,但它頁面還很粗糙,甚至我們剛上線時,有很多海外用戶,卻沒有英文界面。

一定會有用戶提,爲什麼 Runway 支持一個功能你沒有,爲什麼可靈出了 App 你沒有。但一旦你去解決這些簡單問題,模型進步速度就會變慢,因爲精力會分散。當時我們的選擇就是聽算法的,優先做算法上限高的功能。

再比如,上線一個比較大的算法變化,可能會影響用戶數據時,怎麼選?還是根據算法趨勢來決策。2023 年時還會糾結,2024 年基本不糾結了。

晚點:經過去年,圍繞大模型創業的討論從 “誰又融資了” 變成 “誰會先倒下”。你覺得誰會先倒下?誰會活到最後?

閆俊傑:我覺得其實不應該把創業公司分成一個單獨類別。創業公司之間比其實意義不大,應該是整個行業一起。

以及我想說,我覺得 DeepSeek 和智譜是挺不錯的。DeepSeek 很純粹。智譜,他們是最早有 AI 路線圖的,這點我很佩服。

“一年前最喜歡說信仰的那些人,信仰都兌現了嗎?”

晚點:你描述的技術邏輯一以貫之,但一位投資人對 MiniMax 的觀察是:你們 21 年融資時講虛擬人,後面又做 Glow、星野這種類 Character.ai 產品;Kimi 火了之後,重啓了生產力工具海螺;Sora 之後,放了更多資源做視頻生成;接着是現在的開源。

你們好像一直在隨熱點而動。

閆俊傑:這是一些誤解。我們從來就不是想做一個數字人,只是我們三年前創業時,我們說要做無限接近圖靈測試的智能體,有投資人理解爲數字人,當時還沒有大模型投資概念;而我們開始做 Glow 時還沒有 Character.ai;海螺是兩年前就推出了,只是前一年沒有做起來,當大家意識到這個方向火時,Kimi 產品體驗那會兒比我們好,所以可能認爲我們是重啓。

視頻,是最開始做星野和 Talkie 時,我們想讓角色動起來,所以立項的,Sora 出現後,我意識到這個事兒比我想得更大,所以把它做得更通用了。

爲什麼要開源?剛纔講了,最核心是爲了加速技術進化。

晚點:你對 AI 的信仰到底是什麼?看起來你們做過很多事。

閆俊傑:本質上,現在沒人能定義出什麼是 AGI。能定義的只是,智能水平會不停進步。

它有點像長征,你不知道最終目的地具體在哪兒,但你知道更好的智能水平有意義。

晚點:所以很難基於一個明確的終點,步步爲營地倒推?

閆俊傑:創業不是說有個機會,你最合適,你就是天選之子。

創業的前提是你有獨特的理解。第二是,你的資源很可能不是最多的,這也是好事,逼你一定要做出真正的創新。

這種情況下,路徑是什麼?能不能走到那個點?其實不是一開始可以規劃的,是需要一步步去爭取的。

晚點:李開復上週告訴我們,整個行業從信仰 Scaling Law 到懷疑 Scaling Law 只用了一年時間。

閆俊傑:我覺得作爲一個創業者,這時我想的事,不是 Scaling Law 撞牆了,我就放棄了,而是我要做什麼事能讓它延續。

是算法、組織、業務層面的創新,還是方向上的取捨?至少在我們還有機會時,應該努力找方法。

晚點:在討論對 AI 技術的態度時,你覺得信仰是一個合適的詞嗎?

閆俊傑:一年前最喜歡說信仰的那些人,信仰都兌現了嗎?

晚點:你指誰?

閆俊傑:行業裡所有最喜歡說信仰的人,不管中國的還是海外的。

晚點:信仰是一年就能兌現的嗎?

閆俊傑:但至少得朝那個方向做。

晚點:通向信仰的路是直線嗎?不能走彎路嗎?

閆俊傑:但有些動作是相反的。比如前面提到的,花大量錢投放,但問題是,更多的用戶並不會帶來更快的模型能力提升。

晚點:如果不用信仰,你覺得更合適來描述對技術態度的詞是什麼?

閆俊傑:(思考)我覺得是信念。

晚點:信念和信仰的區別是什麼?

閆俊傑:信仰,有點像描述一個很遠的未來;信念是,自己想怎麼做,並能堅持做下去。

“做一個看上去像 o1 的東西沒那麼難,但我們不需要一個新聞稿”

晚點:這次 MiniMax-01 系列更新,技術博客的標題用了 “新架構開啓 Agent 時代”,爲什麼 Agent 是一個重要目標?你怎麼定義 Agent?

閆俊傑:有兩個思考路徑:一是,AI 該往哪個方向變得更強?二是,變強之後,對人類社會能產生哪些有益的變化?

那顯然很重要的一件事是能處理複雜任務,一個標誌可能是多步,它可以是 o1 這樣單次輸出多步,也可以是通過一個單 Agent 拆成多步,還可以像 Anthropic 定義的 workflow 那樣,是更復雜的多 Agent 之間的協同。

如果再定義一下複雜任務,我的理解就是在專業領域能到專業人士的水平。

晚點:去年你說,當時沒人做出成功的 Agent 應用,是因爲大模型能力還不夠強。現在 MiniMax-01 說 “開啓 Agent 時代”,是哪裡變強了?

閆俊傑:這有兩層,一是架構,二是能力。

架構層面,我們現在其實已經做到了,因爲它是可以高效、快速地處理非常長的 context(上下文)。

Long context 重要,是因爲 AI 很難像人那樣感受到時間的流逝,這需要處理越來越長的記憶。對單 Agent,提升互動質量的一個核心是記更多東西。多 Agent 則涉及相互通訊,比如 Anthropic 定義了一個 Agent 間的通訊協議叫 MCP(Model Context Protocol,模型上下文協議),那個通訊量非常長,所以也需要處理長 context 的能力。

在能力層面,我們其實還有很多可以提升的地方,比如 AI 使用工具的能力、規劃能力,我們這個模型還沒打磨好。但這些能力都有很多標準 benchmark(基準),可以慢慢實現。

晚點:你最開始提到,這個架構不完全是 Transformer,那它是什麼?

閆俊傑:標準 Transformer 裡有幾個模塊,我們是把其中一個最重要的 attention(注意力機制),從原來的平方複雜度的注意力變成了線性的注意力。

(注:標準 Transformer 裡的注意力模塊是非線性的,即 “平方複雜度”,線性注意力機制通過簡化計算過程,提高處理長序列的效率,當文本非常長時,計算複雜度是線性增長,而非平方增長,所需算力更小;但線性注意力機制可能在捕捉複雜依賴關係上不如非線性注意力機制。)

晚點:它其實是 Transformer 一個比較大的變體?

閆俊傑:可以這麼理解。

晚點:Google 的 Gemini 之前就用到了線性注意力機制,MiniMax-01 和 Gemini 的線性注意力的異同是什麼?

閆俊傑:我認爲 Google 今年會更強,因爲它同時掌握 TPU(Google 自研的 AI 芯片) 、訓練框架(TensorFlow)和算法,可以一起優化。所以 Google 做這件事相對簡單一點。

而我們不能自己定製 GPU,只能在一個標準硬件上去做,這就會更復雜。

晚點:這是實現難度上,方法和效果呢?

閆俊傑:Google 是閉源的,所以我並不精細知道他是怎麼做的,但應該用了 sliding window attention,它是滑動窗口,一開始記憶可能沒那麼長,但可以分成很多段,然後一個滑窗滑過去。

我們不是滑窗,而是都計算,只是我們找了一些近似算法,讓它算得更快。

(注:sliding window attention 是一種基於局部上下文的技術,它通過在輸入序列上滑動一個固定大小的窗口來計算注意力。這種方法可以有效地捕捉局部依賴關係,同時減少計算複雜度。)

晚點:除了線性注意力帶來的 long-context 和記憶能力,Agent 還需要提升什麼能力?

閆俊傑:就是一些 benchmark,它們大部分是學術界定義的,比如驅動代碼能力進步的一個重要 benchmark 是 SWE-bench。

一年前,模型在這個 benchmark 上的解決率只有百分之十幾,現在是 70% 多。多模態裡也有一些 benchmark。

晚點:爲什麼你們這次沒測 SWE-bench?

閆俊傑:代碼能力是我們下一版本要提升的能力。

晚點:在技術上,達到 benchmark 和優化計算架構是分開的兩件事兒嗎?

閆俊傑:是一體的,你可以認爲,架構指的是你的計算 pattern(形式)長什麼樣,能力是按這個 pattern 計算具體參數。

晚點:怎麼判斷你們選的計算 pattern 能支持更高的能力上限?

閆俊傑:靠認知,也要靠實驗。

決定不同公司研發效率的,首先是你的認知要對,但也有可能兩種認知都對,這時實驗設計和效率就很重要。

怎麼評估我們的研發能力比 9 個月或一年前更強了?關鍵一點是,在框架和數據確定的情況下,我們的實驗收益更高了。這是個核心能力,它很依賴於團隊合作。

晚點:爲什麼 MiniMax-01 面向 Agent,卻不是一個 o1 方向的模型? o 系列被認爲對提升 Agent 能力很有幫助。

閆俊傑:因爲我們需要把每一步做紮實。其實做一個看上去像 o1 的東西沒那麼難,蒸餾幾千條 o1 數據就可以了。我們做過這樣的實驗,最近也有不少這樣的學術論文,這是一個業內共識。

但我們不太需要說自己有個 o1,然後發個新聞稿,我們現在的業務也不依賴於 o1 這類模型。

晚點:你們下一版模型的編程能力提升,是用 o1 的方式來做嗎?

閆俊傑:不光是 coding,還有 planning(規劃)。這件事也取決於,不同任務怎麼用 benchmark 來衡量,找到衡量指標,就能優化。

即使是 o3,它在一些多模態 benchmark 上的分數也很低。

晚點:你怎麼衡量優先級?阿里通義、Kimi、DeepSeek、智譜都已經發布了類似 o 系列的模型,而你們似乎認爲多模態能力的優先級更高?

閆俊傑:第一,一個公司的能力是有限的。

第二,我們思考先優化什麼 benchmark,是基於這個領域是否足夠收斂了,以及我們能在裡面創造多大的獨特價值。o 系列從模型進展到能看到比較清楚的產品形態還需要時間。

過去幾年,最終在一個領域做得好的公司,不一定是第一個做這個方向的公司,而是最能充分發揮這個方向潛力的公司。不在於早一個月、晚一個月。

晚點:編程已經是 Agent 正在落地的場景,而 o1 顯著提升了編程能力。你不認爲這是一個要搶時間窗口的方向嗎?

閆俊傑:Cursor(AI 編程助手)是基於 Claude 3.5 Sonnet 做的,但 Claude 3.5 並不是一個 o 系列模型。

4 個月前,GitHub CoPilot(微軟旗下 AI 編程助手)開始集成 o1,它也沒有變成第一。

晚點:一個現象是,o1 之後,中國公司跟進比 Google、Anthropic 等美國公司更快,你覺得這說明什麼?

閆俊傑:因爲中國公司可能認爲蒸餾是可以做的事兒,而 Anthropic 或 Google 也許不會做。但我也不覺得蒸餾是錯的。

晚點:蒸餾是一種捷徑嗎?

閆俊傑:它肯定是一種路徑。是不是捷徑,見仁見智。

其實在文本模型裡一直有 “對齊稅”——就是如果一定要把模型去對齊一個別的模型,比如 GPT 的結果,會有一些能力受限。

晚點:除了 o1 帶來的邏輯推理、數學和編程等能力提升外,怎麼看它打開的 Inference-Scaling 新空間?這件事的技術意義是什麼?

閆俊傑:這個趨勢之前就有了,比如最簡單的,best of N,你採樣十次,選最好的結果,準確度就會提升。

o1 的進步是把這種思路變成了一個端到端的模型,所以可以整體優化,效果提升了很多。

“Agent 很快還會看到一類應用:信息的獲取”

晚點:你認爲 Agent 最先落地的場景是什麼?

閆俊傑:Coding 肯定是,我覺得很快還會有一類應用,就是信息的獲取。

晚點:我知道你們最近在低調測試一個信息獲取的新產品。可以講一講用 Agent 來做這件事的思路嗎?

閆俊傑:現在信息獲取主要是基於推薦,推薦的內容大概率是你想看的,但不能保證你想看的,都會推給你。

比如我想每天能看到這個領域裡最好的十篇論文,現在的內容平臺都不能滿足這個需求。所以我覺得信息獲取會發生一些變化。

晚點:這聽起來像一個使用新技術方法的今日頭條。

閆俊傑:千萬不要用上一代做移動互聯網產品的方法論來思考新產品。

晚點:哪裡不一樣?

閆俊傑:移動互聯網產品,要思考有哪些供給、哪些消費。而 AI 產品其實不需要(人的)供給。AI 既有分發,也有供給能力,而且 AI 能力會不停變化。

一個移動互聯網產品體驗變好了,大概率是因爲供給變了。而在 AI 產品裡,它主要依賴於模型能力,或者說得到供給的方法發生了變化。

它們(移動互聯網產品和 AI 產品)的週期、確定性都不一樣,增長方式也不一樣。

晚點:Agent 類產品,看到什麼信號時,你們會更多投資源去做增長?

閆俊傑:這可能不是一個對的問題。如果一個產品特別依賴推廣,大概率就不太對。

晚點:星野之前也做了不少推廣。

閆俊傑:Glow 沒有推廣,星野和 Talkie 有一些推廣,到海螺視頻時,我們海外、國內都沒有花錢推廣。

晚點:爲什麼有這個從不推廣,到推廣,再到不推廣的變化?是因爲字節激進加入了戰局?

閆俊傑:不是,是因爲認知升級——從沒做過產品,做第一個產品;到開始學大廠的產品方法論,意識到有好處,也有侷限;再到找到更適合自己的方法。

晚點:上個月我和小馬智行 CTO 樓天成聊 L4,他覺得大模型應用裡,MiniMax 做的星野比較像自動駕駛裡的 L4,它是 AI 在和用戶互動,是替代產生價值;而 ChatGPT、CoPilot 更像 L2,是輔助產生價值。你怎麼看這兩種方向的異同?

閆俊傑:這個總結還挺有意思,確實非常不一樣。

比如 ChatGPT 和 Claude,ChatGPT 更像一個助手,幫你完成任務,Claude 更有溫度。

一個有趣的測試是,你先和模型說一個 1 到 100 間的數,比如 50,你又回他,那我就 50 天不和你說話了。Claude 會說,能不能再給我一次機會?然後他會說個非常小的數。而 ChatGPT 不會這樣。

實質是,怎麼來看待對齊這件事。Anthropic 有一套價值觀,基於此,推出來一套憲法。這導致他的模型具備一些特點和能力。

這是一件上限比較高的事,就是清晰定義,你做的模型到底是什麼。

我覺得中國跟美國模型的一個區別,就是缺少內部定義的 benchmark,一些自己的底層思考和設計,更多是在對齊 o1 等模型的輸出。

晚點:MiniMax 的模型有自己內部的 benchmark,和路線圖嗎?比如 OpenAI 去年提出了一個 L1 到 L5 的 AI 能力分級(聊天機器人、推理者、智能體、創新者、組織者)。

閆俊傑:這是我們要逐漸加強的一件事。

我們最開始的目標是 Intelligence with everyone,實現方式要跟用戶在一起,但我們其實並沒有精確定義每一步到底是什麼。

這可能是一個 “逃出生天” 的邏輯,要一步一步走。我覺得對 OpenAI,目前最有意義的也是 L3(智能體),L4、L5 長什麼樣並不影響他們現在的行動。

“人才密度最高的是字節,其他公司都差一檔”

晚點:你覺得去年到今天,你們實際上做得不錯的技術成果是什麼?

閆俊傑:基礎設施和算力相關的東西。因爲我們每天生成的對話、圖片、視頻和音頻量,都非常大、非常難。怎樣能處理這麼多計算,把它優化、調度好,還有一個合理的成本。這一點,我們應該是業內做得最好的。

然後算法上,我們的多模態比較領先,通用文本暫時不是最領先的,但開始有自己的特色。

晚點:這次 MiniMax-01 更新,首次大規模實現了線性注意力機制,你們描述這是 “非常大膽的創新”,有多大膽?

閆俊傑:我們是第一個在這麼大規模的模型上這麼來做的。

晚點:其他人不這麼做,是因爲不認爲這是一個好方向,還是因爲難?

閆俊傑:都有。這不是一個強共識的東西。

晚點:你們去年最受外界關注的進展,如你所說是多模態,尤其是海螺視頻生成大模型,效果和訪問量現在都是全球第一梯隊,怎麼做到的?

閆俊傑:之前我們已經做過一遍文本(大模型)了,也做過文生圖,有一些積累。

但真的開始做,會發現這些 Infra 其實沒法完全複用到視頻,算法和怎麼做實驗上也有很多變化,怎麼做評價,就更不一樣了。你可以認爲,相當於又新長出了一家公司。

晚點:這些年開發這麼多模型下來,你們技術團隊沉澱的特點和方法論是什麼?

閆俊傑:我們還是相對客觀。這是指,我們有時可能目標定得不對,但一旦能找到正確目標,我們的效率和能做到的深度都比較好。

還有扁平、靈活,溝通比較簡單、直接,我們現在還是我、我的-1,我的 -2 這三個層級。

晚點:客觀是一個特點嗎?難道行業裡很多公司不客觀嗎?

閆俊傑:我覺得是的。非客觀是指,評價技術結果時有一些別的考慮,比如士氣是不是受影響,不同團隊的 scope(範圍) 等等。

晚點:你爲什麼沒提人才密度?比如說我有多少競賽獲獎選手。

閆俊傑:人才密度最高的是字節跳動,其他公司都差一個檔,這是一個事實。而我們也沒想把自己包裝成什麼樣。

但是我想說,兩位同樣優秀的同學,假設一個去了字節,一個去了需要依賴技術和創新安身立命的創業公司。2 到 3 年後,那個去創業公司的人變得顯著更優秀的概率更大。

“大部分做技術的人覺得自己很牛,但我不是這麼認識世界的”

晚點:在 2024 年這麼多行業變化,包括你自己更想清楚了模型和應用不是一個簡單正向循環的關係後,同時做模型和應用,還有必要嗎?爲什麼不聚焦其中一個?

閆俊傑:首先不存在只做模型、不做應用的公司。DeepSeek、Anthropic 都不是。

再來說只做應用、不做模型的公司,這類公司顯然很多,有些做得很好,比如 Perplexity 和 Cursor。

同時,也有既做模型、又做應用的公司,我們也是這樣。我們每做出一個新產品,確實都是因爲先做了模型,有了提升。

晚點:你們 21 年底成立時,大模型並沒有很好的生態基礎,所以你得自己做。如果你更晚創業,會做一個專注應用的公司嗎?

閆俊傑:不會。一是基於現有技術做產品,二是基於未來技術做產品,我想做後一種。

晚點:這是因爲你想做一個價值更大的事?

閆俊傑:不是。是基於怎樣更能發揮出自己的潛力和公司的潛力。

晚點:那些更輕、更聚焦應用的公司,和 MiniMax 這樣模型應用同時做的公司,2025 年會怎麼競爭?

閆俊傑:市場不是有 A,就不能有 B ,其實兩個東西都對。

晚點:你怎麼覆盤去年你們面向生產力場景的海螺 AI(指聊天助手產品,不是海螺視頻)做得不如預期?

閆俊傑:我覺得就是沒有堅持技術驅動。當你發現很多戶用的不滿時,解決思路不應該是去補這些 case,應該找到一些真正的提升方式。

而且到去年 5 月時,我就知道豆包會贏。豆包當時的體驗已經比同類其它產品好了。

同時我也開始意識到,我最開始說的那件事,就是更多用戶並不會導致模型能力提升。那就應該把海螺文本當一個產品,一個業務去思考,我們後來的決定就是不投放。

晚點:你之前說你 3、4 月就想清楚了這個事,爲什麼停止海螺文本投放的時間更晚?

閆俊傑:都是創業中的成長,其實很多認知很簡單,但執行時沒那麼堅定。

晚點:你被什麼東西影響和干擾了?投資人?競爭對手?

閆俊傑:我覺得是人,主要是考慮團隊的感受。

晚點:你什麼時候開始變得更無情了?

閆俊傑:現在也沒有。實際的變化是,我會非常明確得給大家講我認爲的對的東西。有些事沒法妥協。

晚點:另一方面,你們的 AI 社區產品星野是中國表現最好的,比字節、美團等大公司的同類產品都好。暫時領先是爲什麼?

閆俊傑:最關鍵的是,技術路線一定要選對。其次做業務決策時,我們更懂用戶。

晚點:你怎麼去懂他們了,你好像跟星野的用戶畫像並不是很像。

閆俊傑:核心是同理心。

晚點:你認爲自己是個同理心很強的人?

閆俊傑:我覺得是。

實質是,大部分做技術的人會覺得自己很牛,是天才。但我不是這麼認識這個世界的。

“不要區分創業公司和大公司,不要套用移動互聯網”

晚點:從我們 2024 年初那一次聊到現在,你覺得中國大模型競爭格局最大的變化是什麼?

閆俊傑:24 年時,很多人認爲 AI 是把移動互聯網複製一遍,現在至少有一些人開始意識到,其實 AI 不適用移動互聯網的邏輯,這是兩件事。

晚點:這個認知變化怎麼影響競爭格局呢?

閆俊傑:大公司過去積累的優勢,仍有意義,但不是唯一的。這還是因爲,產品用戶越多,模型並不會自然變好。而更好的智能,可能會導出新東西,新東西也會有新商業模式。

晚點:在全球我們看到,Google 花 25 億美元收購了 產品形態跟你們有些相似的 Character.ai 的團隊,這會是 MiniMax 的選項嗎?

閆俊傑:我沒考慮過把公司賣一個什麼價錢。

晚點:我去年把這個新聞發給你時,你說 “感覺是一個 happy ending”。

閆俊傑:對他們來說是,本身創始人也沒那麼喜歡那個產品,他回去後,Gemini 2.0 裡就有他很多貢獻。

晚點:求證一個傳聞,字節 24 年初是不是談過以 40 億美元估值收購 MiniMax?

閆俊傑:沒有這個事。

晚點:你和張一鳴交流過,有什麼收穫?

閆俊傑:至少讓我看到了一個非常頂級的企業家是什麼樣的。

晚點:什麼樣?

閆俊傑:他希望能給這個社會帶來很多正向價值。

晚點:到 24 年下半年,大模型的投資方已是國資輪、中東輪,後面還有多少人能接力?你們怎麼持續獲得充足資金?

閆俊傑:我們沒到這個地步。這還是取決於,怎麼做出自己的好東西。

晚點:其實你去年說過,你不相信中國大模型創業公司能純靠融資,真正的拐點會來自技術、產品或商業化效率的提升。但我瞭解到,你們 24 年的產品和收入都沒有實現年初定下的目標,你怎麼看這件事兒?

閆俊傑:但我們是增長最快的,大概率也是收入最多的。

晚點:所以是目標定太高了?

閆俊傑:核心是,24 年年初定目標時,用的還是移動互聯網的業務邏輯,認知還沒轉變。其實這是兩個行業。

晚點:現在你會怎麼設立目標?2025 年的目標是怎麼定的?

閆俊傑:我覺得這個階段,不應該定一個收入目標,就應該定技術研發目標。

晚點:到去年下半年,大家都看到了大公司,如字節、阿里等的強悍,尤其是豆包的產品表現。這出乎你的預料嗎?

閆俊傑:基本上都在預料之中,我預料的比這還更激烈一點。

我想說,如果你用移動互聯網的思維來看,豆包確實很牛逼,但假定技術會長期發展,不同階段會帶來不同的產品和商業線,這真不一定是件好事。

晚點:你是指用戶增長太快對豆包不是好事,還是指以移動互聯網的思維來看豆包,對行業觀察者是個干擾?

閆俊傑:都不好。還是對比 OpenAI 和 Anthropic,前者用戶規模是後者的幾十倍,但它的估值、資金和人才都不過後者的三倍多。爲了照顧那麼多用戶,OpenAI 要負擔很多東西,有可能拖慢研發節奏。

晚點:所以用戶多,不能直接提升模型能力,多到一定程度反而有可能影響模型發展的速度和靈活性。

閆俊傑:至少看過去一年多,OpenAI 和 Anthropic 的對比就是這樣。

晚點:你反覆提到不要套用移動互聯網的評判標準,那我們看 AI 產品,該看什麼指標?

閆俊傑:海外產品的一個重要指標是訂閱數和付費,而移動互聯網大產品過去主要依賴廣告,這顯然不一樣。

國內產品,我猜也有指標,但我想跑得更好一點再說。

晚點:不和巨頭正面競爭,比如不重投入做豆包類產品,是一個你們的競爭原則嗎?

閆俊傑:是。但本質是,我認爲做 AGI 和做 ChatGPT 類產品是兩件事。

而且當時也開始意識到,提升模型能力,不那麼依賴最多的用戶,那放棄就沒太多心理壓力。

晚點:一位大模型投資人對比過 MiniMax 和月之暗面的市場策略,他認爲月暗是認準做 “生產力場景 + 中國市場”,當然這也是所有大公司投入最多的方向,而 MiniMax 看起來在不斷適應環境,找到了巨頭正面戰場之外的空隙。你會怎麼總結你們的定位策略?

閆俊傑:我們希望自己一直在浪潮裡。這有兩個意思,一是能參與推動浪潮繼續發生;二是我們能讓公司持續發展下去。

“不應該假定,一個公司不會有變動和流失。有才是合理的。”

晚點:你怎麼看去年有些中高層離開 MiniMax?

閆俊傑:本質上是,這個事兒應該是技術驅動的,不是所有人都合適。

晚點:那你是勸退了一些人嗎?會心理負擔比較大嗎?

閆俊傑:必須得克服。

晚點:你做這些事兒拖延了嗎?

閆俊傑:拖延了,這還是屬於認知不夠強。

不應該假定,一個公司不會有變動和流失。有才是合理的。

晚點:實際上你們現在團隊相比 24 年初有什麼變化?

閆俊傑:主要的變化不在於組織架構,而是對人的要求。

一是希望各方向的 leader 是提方案的人,而不要等着別人來提方案,應該更 hands on。

二是我發現,我們想要根據客觀狀態分析找到理性方案的人,而不是直接複製上一家公司經驗的人。

晚點:你說 2025 年你們最重要的目標是技術迭代。這塊你們現在的組織協作和分工方式是怎樣的?資源怎麼分配?

閆俊傑:一方面做東西的資源是相對充足的,另一方面創業公司就得做取捨,但你不該假定所有取捨都是對的,一個關鍵是,怎麼意識到錯了,怎麼及時改。

晚點:什麼機制可以讓你意識到你判斷錯了?

閆俊傑:不 ego。不自我。

晚點:你覺得你是一個容易被說服的人嗎?

閆俊傑:不是

晚點:這和不要 ego 是矛盾的嗎?

閆俊傑:很多事都是矛盾的,MiniMax 這個名字就是矛盾的(MiniMax 作爲技術術語指 “極小化極大算法”。)

還是有一些辦法平衡,就是儘量深入思考,不要被表面、暫時的東西迷惑住。

晚點:MiniMax 現在哪些重要的決策是你來定奪,哪些是放權給其他人?

閆俊傑:創業第一年,我覺得這件事很重要,後面發現其實不重要。

更重要的是,大家怎麼有一個共同的思考基座。因爲每個人做事方式不一樣,如果分得特別清楚,會導致不同模塊的邏輯完全不同,即使每個人都素質很高,一個公司也沒法很好運行。

正確方式是,公司最底層認知能對上,誰來做決策,都會差不多,組織纔會變順。

晚點:大家都錯到一起去了怎麼辦?

閆俊傑:多樣性也是一個很重要的指標了。但是我感覺,真正把公司擰起來的還是那個共同的東西。

晚點:這種不強調劃分的分工方式,會不會讓員工覺得公司的管理很亂?

閆俊傑:讓大家覺得公司管理得很好,其實不是一個目標。

晚點:有 MiniMax 員工說,24 年有段時間感到公司管理決策非常搖擺,這個月核心目標是收入,下個月是增長,下個月又是收入。

閆俊傑:我們後來統一了,這兩個事兒都不是目標,目標是技術迭代。

晚點:管理一個不能用以前的邏輯來套的新的 AI 公司,最大難題是什麼?

閆俊傑:持續招到更好的人。一個事實是,字節現在對人才吸引力最強。但去了字節的人,真正發揮出潛力的比例比創業公司低,字節人太多了。

“最大的痛苦,是不知道要取捨”

晚點:2024 這一年,你自己最大的變化是什麼?

閆俊傑:半年多以前,很多人覺得我有些焦慮,最近半年不再焦慮了。核心是開始意識到要做取捨。

晚點:這一年最大的痛苦是什麼?

閆俊傑:最大的痛苦是不知道要做取捨。當知道了,就不痛苦了。我現在把技術迭代作爲我們最重要的目標。

晚點:你去年反思最多的問題是什麼?

閆俊傑:爲什麼自己的認知能力不能提升更快?

晚點:找到什麼新的提升方法了嗎?

閆俊傑:還是要放下 ego,思考得更深。

晚點:你說過你很重要的一個學習方式,是和比自己強的人交流。去年你見過什麼人,有什麼學習?

閆俊傑:是有的,但我覺得光這樣不夠,本質還是自己能思考得非常深入。

晚點:一個投資人分享了去年和你一起找算力的事。他說你非常極致追求便宜的租金、更短的租期。有一些供應商提出,可以給 MiniMax 一些當地 to B AI 訂單,讓你們考慮更貴的租金,你說你不需要訂單。這是你強硬、不妥協的一面嗎?

閆俊傑:其實不要訂單的原因是我們交付不了,答應了會分散自己的精力,也把別人坑了。

晚點:在 MiniMax,你一直被大家叫 IO,這是 Dota-2 裡的一個英雄。MiniMax 海螺 AI 說:IO 是一個輔助型英雄,主要爲隊友提供增益和保護,在團隊中扮演 4 號位或 5 號位。你爲什麼玩 Dota 2 選了 IO,而且一直叫這個名字?

閆俊傑:其實他不是一直 4 號位、5 號位。TI9 時(Doat 2019 年國際邀請賽決賽),安娜(一位電競選手)使用的上帝小精靈,就是把 IO 變成了 1 號位,非常強,這讓他們戰隊得到了那年的冠軍,當時就覺得這名字挺酷的。

晚點:所以 IO 跟你自己的特點沒什麼直接相關?

閆俊傑:創業還是有很多隨機行爲的。

晚點:輔助型、輸出型,你覺得自己更像什麼類型的英雄?

閆俊傑:其實不應該拆開看,如果一定要說的話,我是特別相信團隊作戰的人。

晚點:2025 年,你覺得可預見的變化是什麼?

閆俊傑:AI 在專業領域達到專業人士水平。這會是一個實質提升,雖然 2025 年不一定全部實現,但會實現一部分。

晚點:新的一年,對自己有什麼新的要求嗎?

閆俊傑:希望自己的技術水平變得更高。剛開始創業時,我還考慮管理的事,後來發現其實沒這麼重要,真正重要的就是技術認知能否不停提升。

晚點:有時你看起來非常適應性,甚至有人會覺得是搖擺,有時非常堅決。哪個更接近真實的你?

閆俊傑:這是一個進步過程。當在一個階段變得更強後,會更堅決。

晚點:你創業時,既不是業界大佬,也不被認爲是 “技術天才”。你認爲自己是什麼類型的創始人?

閆俊傑:我覺得是簡單。簡單是指,知道有一件事,這事也很難,但做好的價值挺大,就堅持做。

題圖來源:MiniMax