☰

OpenAI訓練新模型給ChatGPT找茬

當地時間6月27日，OpenAI 宣佈基於 GPT-4 訓練了一個名爲#CriticGPT# 的模型，用於查找 ChatGPT 聊天機器人輸出內容中的錯誤。它可以撰寫評論，強調 ChatGPT 生成答案中不準確的地方。

據介紹，CriticGPT 旨在協助人類 AI 訓練員完成工作 —— 使用一種名爲“從人類反饋中強化學習（Reinforcement Learning from Human Feedback，RLHF）”的技術來訓練、改進 GPT-4 的回答。然而隨着 ChatGPT 的準確性日益提升，錯誤越來越隱蔽，導致 AI 訓練員的工作越來越“難做”。

相關資訊

▣ OpenAI：訓練了一個基於GPT-4的模型，用於捕獲ChatGPT代碼輸出中的錯誤
▣ OpenAI已啓動下一代前沿模型訓練
▣ OpenAI新ChatGPT o1模型竟在測試中作弊？
▣ ChatGPT幕後大佬、o1推理模型作者官宣離職！OpenAI大洗牌，後訓練團隊換將
嵌入式模型成本降低75% OpenAI發佈ChatGPT更新
▣ OpenAI宣佈開始訓練新旗艦模型，用上還需要再等等？
▣ 多名作家起訴OpenAI：濫用其作品訓練ChatGPT
▣ OpenAI推遲ChatGPT新語音模式
ChatGPT教育版推出對話和數據不用於訓練模型
▣ OpenAI 舉報人因版權數據訓練模型滿心厭惡
▣ OpenAI：新GPT-4 Turbo模型現可供付費ChatGPT用戶使用
▣ OpenAI大重啓：新模型想讓你相信ChatGPT像人思考
OpenAI新模型給力輝達GPU進補
▣ OpenAI上新，發現ChatGPT代碼輸出錯誤的大模型來了！
▣ OpenAI推出“滿血版”推理模型o1和ChatGPT Pro
▣ OpenAI 與《時代》達成合作：可用雜誌內容訓練ChatGPT
OpenAI推ChatGPT電話服務　稱語音不會用於訓練AI
▣ “越大越好”的路徑走不通？OpenAI正在尋求訓練模型的新方法
▣ OpenAI發佈文生圖模型：ChatGPT即將融入，文字生成圖片模型。
▣ 違規訓練ChatGPT 意大利對OpenAI處以1500萬歐元罰款
OpenAI獲《金融時報》內容授權：可訓練模型和實時調用
▣ 11位作者起訴OpenAI和微軟濫用書籍訓練AI大模型
▣ 騰訊公司申請模型訓練專利，提升模型訓練效果
ChatGPT將滿2歲！OpenAI擬推新AI旗艦模型恐比它強大100倍
▣ OpenAI與《時代》雜誌達成合作協議，將用其內容訓練ChatGPT
Google新AI模型硬槓ChatGPT
▣ YouTube視頻被OpenAI用來訓練大模型？CEO稱暫無證據但此舉違規
▣ Google推新模型槓OpenAI
▣ OpenAI推理模型“上新”

DMCA | PRIVACY | s@bg3.co