☰

OpenAI王炸新一波：向第三方開發者開放最強推理模型o1，更低價GPT-4o進入API

本文作者：李丹

來源：硬AI

在爲期12個工作日的線上新品和新技術發佈活動中，OpenAI的王炸又來了一波：將OpenAI的最強推理模型o1向開發者開放，用於開發語音類App的API中納入了收費更低的先進模型GPT-4o版本。

美東時間12月17日週二進行的第九日線上分享中，OpenAI宣佈，從週二開始，通過應用程序編程接口（API）向第三方開發者推出o1。但OpenAI並非向所有開發者敞開使用o1，而是以“第五層”使用類別的形式提供，要獲得第五層的使用資格，開發者必須在OpenAI的產品上花費至少1000 美元，並且擁有的賬戶自首次成功付款以來已使用超過30天。

雖然OpenAI只是向部分開發者推出了o1，但此舉已經標誌着開發者在AI領域的最新進步，他們將有機會打造新的高級 AI 應用程序App，或者將最先進的 OpenAI 技術集成到他們現有的App和工作流程中，無論是面向企業還是面向消費者。

今年9月，OpenAI 發佈了o1的預覽版o1 preview，稱o1是第一個具備真正通用推理能力的大模型，它的核心能力推理在測試化學、物理和生物學專業知識的基準GPQA-diamond上得到了充分體現。

據OpenAI的評估，o1在該測試中全面超過了人類博士專家，準確率達到78.3%，而人類專家的得分爲69.7%。OpenAI稱，“通用人工智能(AGI)之路，已經沒有任何阻礙”。此外，o1在多個高難度的推理基準測試中表現優異，例如在美國數學邀請賽（AIME）中，o1的正確率達到了83.3%，遠超其前身GPT-4o的表現。

本月5日，OpenAI在預告的連續12日王炸發佈活動首日就推出了正式版的o1，所謂滿血o1，它被納入ChatGPT Plus套餐。正式版o1支持多模態輸入，具備視覺推理能力。相比o1 preview版本，正式版o1的平均響應速度快了60%，OpenAI還發現正式版o1在推理時犯重大錯誤的頻率比o1 preview減少34%。

在包括編碼、數學和視覺推理任務在內的一系列基準測試中，正式版o1都相比預覽版取得了明顯進步。例如在SWE-bench Verified基準的編碼測試中，o1的評分從o1 preview的41.3 提高到 48.9，而以數學爲重點的 AIME 測試中的評分甚至從 42 躍升至 79.2。

O1的新功能爲開發者提供更多幫助。比如結構性輸出Structured Outputs功能讓響應可靠地匹配自定義格式，如JSON模式，從而確保與外部系統交互時的一致性；函數調用Function calling功能簡化了將 o1 連接到 API 和數據庫的過程；對視覺輸入進行推理的能力Vison capabilities發掘了製造、科學和編碼方面用例的前景。

開發人員還可以使用新的reasoning_effort參數微調o1的行爲，該參數控制模型在任務上花費的時間，以此平衡性能和響應時間。

本週二推出的API中，正式版o1替代了API中已有的o1 preview版本。因爲需要大量計算資源才能運行o1，OpenAI對o1 API的收費也較高，o1每分析約75萬個單詞收取 15 美元，模型每生成約75萬個單詞收取60 美元，相當於OpenAI最新非推理模型GPT-4o收費的三到四倍。

同時，o1的延遲更低，對於給定的請求，o1使用的推理token比 o1-preview 平均少 60%。

更新Realtime API，納入收費更低的新版GPT-4o和4o mini模型，支持WebRTC

本週二OpenAI還更新了支持語音助手、實時翻譯工具等低延遲自然對話體驗的Realtime API。Realtime API目前還處於測試階段，用於打造低延遲的AI 生成語音響應的App，此次更新中包括GPT-4o 和 GPT-4o mini模型各自的新版本，新版本的數據效率更高、可靠性提高，用起來也更便宜。

更新後Realtime API擁有一些新功能，比如併發帶外響應，它可以讓內容審覈等後臺任務在不中斷交互的情況下運行。該API現在還支持 WebRTC，它是爲基於瀏覽器的客戶端、智能手機和物聯網設備構建實時語音應用程序的開放標準。

在Realtime API中結合WebRTC意味着，API可以直接支持音頻流、噪聲抑制和擁塞控制，從而簡化打造基於語音的App。開發者現在可以以最少的設置集成實時功能，即使在多變的網絡條件下也是如此。藉助WebRTC，開發者現在只需幾行 Javascript代碼即可添加Realtime功能。

OpenAI同時降低了Realtime API的收費，將GPT-4o音頻的定價降低了60%，降至每 100 萬個輸入token收費40 美元，每 100 萬個輸出token收費80 美元。

緩存音頻輸入定價降低了87.5%，現在定價爲每100 萬個輸入token收費2.50 美元。OpenAI將要添加的更小模型 GPT-4o mini定價更便宜，每 100 萬個輸入token收費10 美元，每 100 萬個輸出token收費20 美元。

GPT-4o mini 的文本token費率也大幅下調，輸入token起步價0.60 美元，輸出token起步價2.40 美元。

OpenAI王炸新一波：向第三方開發者開放最強推理模型o1，更低價GPT-4o進入API

相關資訊