☰

OpenAI將開源SimpleQA新基準，以衡量大模型真實性

當地時間10月30日，美國開放人工智能研究中心（OpenAI）宣佈，爲了衡量語言模型的真實性，將開源一個名爲SimpleQA的新基準。該基準可衡量語言模型回答簡短的事實尋求（fact-seeking）問題的能力。

相關資訊

▣ 一週Martech新聞：OpenAI將發佈新開源AI模型
▣ 長江證券：開源模型性能追趕閉源大模型 OpenAI正式進軍AI搜索
▣ 開源模型Llama3發佈，原來Meta纔是真OpenAI？
▣ 全球科技早參丨雲服務助微軟業績雙超預期；OpenAI將開源SimpleQA新基準；蘋果宣佈MacBook Air升級標配16GB內存
▣ 大模型融合！最新「進化算法」全自動組合開源模型，刷榜多項基準測試
▣ OpenAI 的新“o1”模型真能帶來重大進步？
▣ 全球開源大模型新王！阿里Qwen2.5來了，性能跨量級超Llama3.1
▣ Nvidia的新開源AI模型在基準測試中擊敗了GPT-4o
▣ 數智早參｜OpenAI官宣推出新的大語言模型GPT-4o；騰訊混元文生圖大模型開源
OpenAI o1 AI模型規劃能力實測準確率達97.8%
▣ 谷歌發佈Gemma 2輕量級模型，以牽制Meta的開源模型Llama 3
▣ 馬斯克反擊“封閉”的OpenAI：開源全球最大參數模型
▣ OpenAI開發者大會派禮包：大幅降低模型成本，AI語音加持App，小模型“蹭”大模型性能
▣ AI早知道｜B 站開源輕量級 AI 語言模型；阿里通義Qwen2成最強開源大模型
歐洲版OpenAI，法國獨角獸推多模態大模型Pixtral 12B，源代碼已開放下載
▣ OpenAI對手推出新模型
▣ OpenAI公開反對AI大模型監管法案
▣ OpenAI發佈推理大模型OpenAI o1系列
▣ OpenAI和Meta準備推出具有“推理”能力的新AI模型
微軟傳擬推出新AI模型足以匹敵Google和 OpenAI
OpenAI新模型更像人類了
▣ 微軟傳推出最新AI模型開戰谷歌、OpenAI
▣ AI週報| 大模型測不出9.11和9.9哪個大；OpenAI發佈輕量化模型GPT-4o mini
▣ OpenAI CEO談AI：中國將有獨特的大模型，全球10-20個大模型能“存活”
▣ 比擴散模型快50倍！OpenAI發佈多模態模型實時生成進展
21新款賓利添越是衡量其他SUV的基準
▣ 對話曠視科技唐文斌：應用落地是衡量大模型價值的最高標準
▣ OpenAI訓練新模型給ChatGPT找茬
▣ “草莓”來了？OpenAI發佈新模型

DMCA | PRIVACY | s@bg3.co