OpenAI推五級評估系統!評估AI能力達到什麼水平

7月12日消息,OpenAI設計了一個五級評估系統,用於追蹤人工智能軟件在超越人類能力上的開發進展。這反映了該公司最新的嘗試,旨在增進公衆對AI安全性和未來的理解。

一位發言人透露,OpenAI在週二的全員會議中向員工介紹了這一新的分類系統。OpenAI還計劃將這些信息分享給投資者及公司外部的其他人士。目前OpenAI被廣泛認爲是構建更強大人工智能系統的領軍者之一。

OpenAI的系統劃分了五個等級,按一到五的數字由低到高排列等級。具體來說,這五個等級分別是:

最低一級:聊天機器人(Chatbots),能夠使用自然語言進行對話的人工智能

二級:推理者(Reasoners),可以解決人類級別問題的人工智能

三級:智能主體(Agents),能夠代表用戶採取行動的人工智能

四級:創新者(Innovators),能助力發明創新的人工智能

最高五級:組織(Organizations),能夠執行復雜組織任務的人工智能

OpenAI的高管向員工透露,公司目前認爲自己處在第一級,但正處於即將進入第二級“推理者”階段的邊緣。這一級別的系統能像一個博士一樣,在沒有任何工具的情況下執行基本問題解決任務。

在同一次會議上,公司領導展示了一個涉及其GPT-4人工智能模型的研究項目,據一位不願透露身份的知情人士稱,OpenAI認爲該模型展現了一些類似人類的推理新技能。對於這次演示,發言人表示OpenAI始終在內部測試新功能,這在業界是常見的做法。

多年來,OpenAI一直致力於構建所謂的通用人工智能(AGI)——從理論上講,這種計算機系統在大多數任務上的表現能超過人類。然而,這樣的系統目前還不存在。OpenAI首席執行官薩姆·奧特曼(Sam Altman)曾預測,AGI可能在未來十年內實現。

關於如何確定達到AGI的標準,AI研究者們一直在進行討論和探索。在2023年11月的一篇論文中,谷歌DeepMind的幾位研究員提出了一個包括五個級別的AI框架,其中包括像“專家”和“超人”等級別。這個排名系統與汽車行業用來評估自動駕駛汽車自動化程度的系統類似。

據瞭解,OpenAI五級評估系統由公司高層領導制定,目前仍在不斷完善中。公司將從包括員工、投資者及其董事會在內的多方面收集反饋,並可能隨時間調整這些級別。(小小)