Mistral董事會成員:六個月前已發現DeepSeek令人瞠目結舌性能

鞭牛士報道,2月1日消息,據TC報道,Andreessen Horowitz 普通合夥人兼 Mistral 董事會成員 Anjney“Anj”Midha告訴 TechCrunch,他六個月前首次發現了DeepSeek 令人瞠目結舌的性能。

當時 DeepSeek 推出了 Coder V2,根據該公司去年發佈的一篇論文,它在編碼特定任務方面可與 OpenAI 的 GPT4-Turbo 相媲美。

他說,這使得 DeepSeek 走上了每隔幾個月發佈改進模型的道路,直到 R1。R1 是其新的開源推理模型,它以極低的成本提供行業標準性能,顛覆了科技行業。

儘管Nvidia 的股票遭到拋售,但 Midha 表示 R1 並不意味着 AI 基礎模型將停止花費數十億美元購買 GPU 芯片並儘快建設更多數據中心。

這意味着他們將利用所獲得的計算能力做更多的事情。

「當人們說,好吧,Anj,Mistral 已經籌集了 10 億美元。」他說。「DeepSeek 是否意味着所有這些 10 億美元都是完全不必要的?不,實際上,能夠看到 DeepSeek 的效率改進,將其內化,然後向其投入 10 億美元,對他們來說非常有價值。」

他補充道:現在我們可以從相同的計算中獲得 10 倍以上的輸出。

他辯稱,這並不意味着 Mistral 完全落後於競爭對手 OpenAI 和 Anthropic。這兩家公司籌集的資金都比 Mistral 多得多。據報道,OpenAI 正在商談再籌集400 億美元。

他說,Mistral 之所以能與他們競爭,是因爲它是開源的。他的邏輯確實有道理。開源讓公司能夠從那些想要提供幫助的人那裡獲得基本上免費的技術勞動力,因爲他們使用該項目。閉源競爭對手保守着他們的秘密,必須支付所有勞動力和計算能力的費用。

「你不需要 200 億美元。你只需要比任何其他開源模型應用程序更多的計算能力。因此 Mistral 的定位很好。他們擁有所有開源提供商中最多的計算能力。」Midha 談到他的投資組合公司時說道。

Facebook 的 Llama 是 Mistral 最大的西方開源 AI 模型競爭對手,也將獲得更多投資。首席執行官馬克·扎克伯格週三表示,他仍計劃在 AI 上投入數千億美元。其中包括 2025 年的 600 億美元資本支出,主要是數據中心。

Midha 還是 AI 圖像生成器 Black Forest Labs 和3D 模型製造商 Luma的董事會成員(也是 AI 機構 Anthropic、ElevenLabs 等的天使),他還有另一個理由認爲 AI 對 GPU 的需求不會很快減弱。

他是a16z 的 Oxygen 項目的負責人。GPU,尤其是 Nvidia 最先進的 H100,已經成爲一種稀缺商品,以至於這家風險投資公司在大約一年半前開始着手解決這個問題。它購買了一批 GPU 供其投資組合公司使用。

Midha 笑着說,Oxygen 現在超額預訂了。我無法分配足夠的資源。

他的初創公司不僅需要 GPU 來訓練 AI 模型,還需要更多的 GPU 來爲客戶運行他們正在開發的 AI 產品。

「現在對於推理和消費的需求是無止境的。」他解釋道。

這也是他認爲 DeepSeek 的工程突破也不會改變星際之門的原因。這是OpenAI本月早些時候與軟銀和甲骨文宣佈的 5000 億美元 AI 數據中心合作計劃。

DeepSeek 帶來的重大變化是各國認識到人工智能是下一個基礎設施,就像電力和互聯網一樣。米德哈希望各國考慮“基礎設施獨立性”,他這樣說道。他們是想依賴中國模式,接受審查制度,控制數據?還是想要遵循西方法律和道德規範並遵守北約協議的西方模式?

他顯然主張西方國家採用西方模式,比如他位於巴黎的 Mistral。數百家公司也有同樣的擔憂,並已屏蔽了 DeepSeek,它既是一項消費者應用服務,也是一種開源模式。

並非所有人都對中國開源模式心存畏懼。各公司可以在自己的數據中心本地運行這些模式。此外,DeepSeek 已作爲一項安全雲服務由Microsoft Azure Foundry等美國公司提供,因此開發人員不必使用 DeepSeek 的雲服務。

事實上,英特爾前首席執行官帕特·基辛格(Pat Gelsinger)——一位熟悉中國市場的人——告訴 TechCrunch,他的初創公司 Gloo 正在基於他們自己版本的 DeepSeek R1 構建 AI 聊天服務,而不是像 Llama 或 OpenAI 這樣的選擇。

但如果有人想因爲 DeepSeek 而放棄他們的數據中心計劃,Midra 笑着提出了一個請求:「如果你有多餘的 GPU,請將它們發送給 Anj。」