OpenAI王炸新一波:向第三方開發者開放最強推理模型o1,更低價GPT-4o進入API

本文作者:李丹

來源:硬AI

在爲期12個工作日的線上新品和新技術發佈活動中,OpenAI的王炸又來了一波:將OpenAI的最強推理模型o1向開發者開放,用於開發語音類App的API中納入了收費更低的先進模型GPT-4o版本。

美東時間12月17日週二進行的第九日線上分享中,OpenAI宣佈,從週二開始,通過應用程序編程接口(API)向第三方開發者推出o1。但OpenAI並非向所有開發者敞開使用o1,而是以“第五層”使用類別的形式提供,要獲得第五層的使用資格,開發者必須在OpenAI的產品上花費至少1000 美元,並且擁有的賬戶自首次成功付款以來已使用超過30天。

雖然OpenAI只是向部分開發者推出了o1,但此舉已經標誌着開發者在AI領域的最新進步,他們將有機會打造新的高級 AI 應用程序App,或者將最先進的 OpenAI 技術集成到他們現有的App和工作流程中,無論是面向企業還是面向消費者。

今年9月,OpenAI 發佈了o1的預覽版o1 preview,稱o1是第一個具備真正通用推理能力的大模型,它的核心能力推理在測試化學、物理和生物學專業知識的基準GPQA-diamond上得到了充分體現。

據OpenAI的評估,o1在該測試中全面超過了人類博士專家,準確率達到78.3%,而人類專家的得分爲69.7%。OpenAI稱,“通用人工智能(AGI)之路,已經沒有任何阻礙”。此外,o1在多個高難度的推理基準測試中表現優異,例如在美國數學邀請賽(AIME)中,o1的正確率達到了83.3%,遠超其前身GPT-4o的表現。

本月5日,OpenAI在預告的連續12日王炸發佈活動首日就推出了正式版的o1,所謂滿血o1,它被納入ChatGPT Plus套餐。正式版o1支持多模態輸入,具備視覺推理能力。相比o1 preview版本,正式版o1的平均響應速度快了60%,OpenAI還發現正式版o1在推理時犯重大錯誤的頻率比o1 preview減少34%。

在包括編碼、數學和視覺推理任務在內的一系列基準測試中,正式版o1都相比預覽版取得了明顯進步。例如在SWE-bench Verified基準的編碼測試中,o1的評分從o1 preview的41.3 提高到 48.9,而以數學爲重點的 AIME 測試中的評分甚至從 42 躍升至 79.2。

O1的新功能爲開發者提供更多幫助。比如結構性輸出Structured Outputs功能讓響應可靠地匹配自定義格式,如JSON模式,從而確保與外部系統交互時的一致性;函數調用Function calling功能簡化了將 o1 連接到 API 和數據庫的過程;對視覺輸入進行推理的能力Vison capabilities發掘了製造、科學和編碼方面用例的前景。

開發人員還可以使用新的reasoning_effort參數微調o1的行爲,該參數控制模型在任務上花費的時間,以此平衡性能和響應時間。

本週二推出的API中,正式版o1替代了API中已有的o1 preview版本。因爲需要大量計算資源才能運行o1,OpenAI對o1 API的收費也較高,o1每分析約75萬個單詞收取 15 美元,模型每生成約75萬個單詞收取60 美元,相當於OpenAI最新非推理模型GPT-4o收費的三到四倍。

同時,o1的延遲更低,對於給定的請求,o1使用的推理token比 o1-preview 平均少 60%。

更新Realtime API,納入收費更低的新版GPT-4o和4o mini模型,支持WebRTC

本週二OpenAI還更新了支持語音助手、實時翻譯工具等低延遲自然對話體驗的Realtime API。Realtime API目前還處於測試階段,用於打造低延遲的AI 生成語音響應的App,此次更新中包括GPT-4o 和 GPT-4o mini模型各自的新版本,新版本的數據效率更高、可靠性提高,用起來也更便宜。

更新後Realtime API擁有一些新功能,比如併發帶外響應,它可以讓內容審覈等後臺任務在不中斷交互的情況下運行。該API現在還支持 WebRTC,它是爲基於瀏覽器的客戶端、智能手機和物聯網設備構建實時語音應用程序的開放標準。

在Realtime API中結合WebRTC意味着,API可以直接支持音頻流、噪聲抑制和擁塞控制,從而簡化打造基於語音的App。開發者現在可以以最少的設置集成實時功能,即使在多變的網絡條件下也是如此。藉助WebRTC,開發者現在只需幾行 Javascript代碼即可添加Realtime功能。

OpenAI同時降低了Realtime API的收費,將GPT-4o音頻的定價降低了60%,降至每 100 萬個輸入token收費40 美元,每 100 萬個輸出token收費80 美元。

緩存音頻輸入定價降低了87.5%,現在定價爲每100 萬個輸入token收費2.50 美元。OpenAI將要添加的更小模型 GPT-4o mini定價更便宜,每 100 萬個輸入token收費10 美元,每 100 萬個輸出token收費20 美元。

GPT-4o mini 的文本token費率也大幅下調,輸入token起步價0.60 美元,輸出token起步價2.40 美元。