OpenAI的新挑戰:九大產品繁雜難以管理,讓用戶眼花繚亂

智東西編譯 吳浪娜編輯 漠影

智東西9月29日消息,據Supervised今天報道,雖然OpenAI的最新模型o1在性能上有了顯著提升,但它也給該公司帶來了一個潛在的新挑戰:產品組合繁雜。

OpenAI的最新產品o1和o1-mini,實際上讓用戶和客戶在性能和成本之間做出了權衡:你可以選擇等待更長時間,並暫時支付更多費用,但輸出結果應該會好得多。它不是那種可以插入呼叫中心的應用程序接口(API),但它確實爲這家已經覆蓋了一系列細分市場(除了沒有“一個幾乎無所不能的產品”)的公司填補了一種新的細分市場。

o1的應用場景基本上是“你需要稍微思考一下”的問題。美國雲服務管理平臺Box CEO亞倫·列維(Aaron Levie)給出了一個極好的企業應用場景,即需要找到合同中一個非常具體的參數——例如,合同的最終簽署日期,也就是合同實際生效的日期。這是一個真正“需要稍微思考一下”的問題,在一個原本簡單的問題上增加了一層複雜性,人們可能在不同的日子簽署了合同。

這對於OpenAI來說也是一種相對較新的應用場景。在過去,OpenAI可能需要調用一系列很長的API,並請求模型以提示調整或檢索增強生成(RAG)的形式完成所需任務。相反,整個過程可能會被壓縮成一兩次調用,從而簡化某些架構。OpenAI已經經歷了一種“SaaS化”的過程,在這一過程中,OpenAI逐漸成熟,成爲一家真正的企業。

隨着OpenAI逐漸發展成爲一個真正的企業,其產品組合(或稱爲模型組合)日益複雜,OpenAI正面臨着公司產品組合繁雜的挑戰。產品組合越龐大,管理難度就越大,處於這一階段的公司面臨的最大挑戰就是如何避免產品組合變得繁雜,難以向用戶傳達價值。而且隨着模型質量的不斷提高,任何微小的分心都可能導致OpenAI被其他前沿模型公司超越。

Supervised總結了OpenAI現在非常龐大的API組合,共有9個產品:

1、GPT-4o:一個多模態、昂貴(雖然也沒能倖免於降價影響)的模型,應該是通用型的好產品。

2、GPT-4o mini:GPT-4o的削弱版本,旨在作爲其主力模型GPT-3.5 Turbo的繼任者,以滿足大量更簡單的應用場景。

上述模型的微調版本,可滿足企業的特定需求,儘管它們通過API提供,這可能會讓一些更注重安全性的公司望而卻步。

3、o1:一個以速度和價格爲代價換取質量的模型,允許它有更多時間對答案進行“推理”。基本上就是需要“停下來想一想”的問題。

4、o1-mini:就像4o mini一樣,是o1的削弱版本,設計用於……同樣的“停下來想一想”的問題,但我們可以假設它確實能解決一系列問題。

5、Whisper:可以說是市場上最好的語音轉文本模型,可以肯定的是,它是爲生成OpenAI所需的訓練數據而構建的。

6、文本嵌入:算不上最好的嵌入產品,但其優勢通常在於它與其他OpenAI產品一起提供,從而減少了採購的麻煩。

7、文本轉語音:假設延遲正常,你可以將其應用到類似呼叫中心裡的API。它有普通和高清兩個版本的API。

8、高級語音助手:一個技術奇蹟般的產品,它可以讓你在ChatGPT內進行主動對話,儘管其應用場景仍然不太明確。

9、ChatGPT:OpenAI將上述所有內容“產品化”,集合到一個前端企業友好型的包裝中。

在此期間,Meta開始顯示出更多的混亂,它在幾乎每一個類別中都發布了更新的模型。不過Meta這些模型是開源的,併爲一系列非常不同的產品提供支持,儘管它們存在於同一個“桶”中。通過o1,OpenAI本質上是在再次嘗試創建新的類別,但同時也冒着產品組合繁雜的風險。

下面對比了OpenAI和其競爭對手的產品定價:

▲OpenAl的產品在價格和用途上存在差異(圖源:X)

這些費用可能遠未達到o1發佈一段時間後的水平。OpenAI已經開始逐步增加速率限制,最近o1-preview從每週30個增加到50個,o1-mini從每週50個增加到每天50個。

▲OpenAI在社交平臺X上分享道,將逐步增加o1-preview和o1-mini的速率限制(圖源:Supervised)

雖然OpenAI的吸引力一直在於便利、價格和性能之間的某個最佳平衡點,但其繁雜的產品組合無疑既是挑戰也是機遇。該文章作者馬修·林利(Matthew Lynley)嚴重懷疑價格不會一直這麼高,因爲其下一個GPT模型遲早會準備好。但就目前而言,它至少在試圖籌集鉅額資金的時候,開發者擁有了一些價格較高的產品當作談判籌碼。

然而,這裡的挑戰與任何成熟企業隨時間推移開始面臨的挑戰相同:產品繁雜。雖然OpenAI在技術上以API和ChatGPT的形式擁有“兩個”產品,但這些產品都有大量的分支,服務於非常廣泛的應用場景。這些API也遠遠超出了聊天補全和文本生成的範圍,包括了各種各樣的模態。而它的語音產品看似是ChatGPT“驚豔”的部分,其實可能是其產品組合中最尷尬的部分。

產品繁雜在創業領域是一個公認的問題,如果你還能稱OpenAI爲一家初創公司的話。隨着初創公司的成熟,其用戶和客戶羣的不斷擴大,它必須有方向性地發展,更少的產品滿足更多客戶的需求,而不是爲每個人構建一切。或者更簡潔地說,做幾件事,但都要做好。

提供如此廣泛的應用場景,讓OpenAI能夠將用戶引導到某種穩定狀態,在這種狀態下,它不一定賺錢,但至少不會虧本。在API方面,傳統的做法是將用戶推向其主力模型(特別是微調版本),但對於ChatGPT而言,這一點就不太清楚了。

雖然新模型在ChatGPT中是有速率限制的,但這也是OpenAI除了API之外極其重要的業務部分。據The Information報道,OpenAI COO布拉德·萊特卡普(Brad Lightcap)告訴員工,OpenAI擁有超過1000萬名ChatGPT的付費訂閱用戶,另外還有100萬名企業訂閱用戶。(彭博社此前曾報道,OpenAI有100萬名ChatGPT的企業訂閱用戶。)

當然,我們可以做很多粗略的計算,但都會得出相同的結論:除了API之外,ChatGPT的企業業務現在和將來都會是OpenAI業務的重要組成部分。

但ChatGPT帶來的收入並不會像API那樣,直接隨着o1的使用而增長。無論是通過API還是ChatGPT內部運行o1,實際運行它的成本可能會隨着預訓練計算資源轉向推理而發生變化。

幸運的是,OpenAI在這一領域已經有了很多進展。業內人士目前額外關注的一種方法是蒙特卡洛樹搜索(Monte Carlo Tree Search),它可以減少生成高質量結果所需的計算量。蒸餾(distillation)是另一種“縮小”大模型的方法,隨着人們的興趣轉向管理高性能模型的推理成本,蒸餾法也獲得了很大的發展。 (蒸餾是一種機器學習模型壓縮方法,它用於將大型模型的知識遷移到較小的模型中。)

“這就是甜點,將傳統預測性機器學習的策略與現代技術相結合。”模型開發商和平臺h2o的聯合創始人兼CEO斯里·安巴蒂(Sri Ambati)告訴馬修,“樹狀搜索是一個絕對的天才技巧,它是一種非常容易實現的目標,與大語言模型的卓越性相結合。”

在與專家和知情人士交談的交談中,最常提到的另一點是諾姆·布朗(Noam Brown)在OpenAI的工作。布朗被廣泛認爲是博弈論領域的頂尖專家,許多人都想知道他的工作將如何應用到OpenAI的產品中。布朗還是一篇論文的共同作者,該論文部分研究了蒙特卡洛樹搜索在開發類人代理中的應用。

結語:OpenAI面臨成本挑戰,降價保競爭力

OpenAI的API面臨的挑戰是,根據最近與大多數企業和平臺的情況,在爲場景構建AI應用時,成本是第一或第二重要的考慮因素。但OpenAI已經表現出逐漸降低價格以保持競爭力的意願。

此外,ChatGPT的企業業務似乎是OpenAI業務的主要驅動力,這也很說明問題,因爲所有這些開發基本上都是爲該企業套件服務的。對於那些在管理和成本方面有更高要求的公司來說,使用現成的廉價產品在公司內部開發定製產品的做法越來越有吸引力。

有一種憤世嫉俗的觀點認爲,OpenAI試圖說:“嘿,看,我們還在創造非常先進的東西,別忽視我們的融資號召。”

然而,這種觀點的另一面是,根據CNBC的報道,OpenAI似乎已經獲得了一輪超額認購的鉅額融資,已經成長爲一家更適合企業產品的公司。現在,OpenAI只需要確保其在銷售電話中不會用龐大的產品組合迷惑企業。

來源:Supervised