OpenAI 開源了一個名爲...

OpenAI 開源了一個名爲 SimpleQA 的基準測試,用於衡量語言模型在回答簡短、追求事實的問題方面的能力。強調回答的準確性,旨在測試模型是否 “知道自己知道什麼”。地址: 網頁鏈接