OpenAI迴應《紐約時報》起訴,稱泄露文章特定內容是"罕見bug"

1月9日消息,針對《紐約時報》最近提起的版權侵權訴訟,美國人工智能初創公司OpenAI週一發表聲明,對該報的指控進行了回擊。

去年12月,《紐約時報》對微軟和OpenAI提起訴訟,指控它們在訓練聊天機器人ChatGPT時,非法使用了該報的新聞內容,侵犯了其知識產權。在提交給紐約南區聯邦地方法院的訴訟文件中,《紐約時報》要求微軟和OpenAI爲“非法複製和使用《紐約時報》獨特且具價值的作品”承擔“數十億美元的法定和實際損害賠償”責任。

對於這一指控,OpenAI在聲明中明確表示不認同,並強調:“我們一直在與新聞機構合作,共同開創新的機遇。培訓屬於合理使用數據的範疇,同時我們也提供了退出選項,以示尊重。”該公司進一步指出,“反流”(Regurgitation,即泄露特定內容或文章完整“記憶”部分)是“一個罕見的漏洞,我們正在積極努力消除它”。

此外,OpenAI還暗示《紐約時報》可能“故意操縱了提示內容”,並“從衆多嘗試中挑選了他們的內容作爲訴訟證據”。

OpenAI的聊天機器人等產品所依賴的生成式人工智能技術是由大語言模型驅動的。這些模型能夠吸收新聞報道、社交媒體帖子等大量網絡文本數據,通過分析這些書面材料來生成新的文本內容,如事件摘要等,以迴應用戶查詢。

OpenAI在博客文章中透露,他們與《紐約時報》的溝通“在12月19日的最後一次交流中似乎取得了建設性進展”,雙方談判的焦點是在ChatGPT中展示帶有歸屬的《紐約時報》內容。這一舉措似乎與傳媒公司Axel Springer最近與OpenAI達成的協議類似。然而,《紐約時報》在12月27日提起的訴訟讓OpenAI感到“意外和失望”。

儘管使用在線數據一直是企業和學術研究人員的常規操作,但在硅谷的人工智能熱潮中,這類系統最近卻遭到了藝術家和其他內容創作者的猛烈抨擊。他們認爲自己的作品被用於技術開發卻沒有得到應有的報酬。這些問題已經引發了衆多其他訴訟案件。

去年9月,包括喬納森·弗蘭岑(Jonathan Franzen)、約翰·格里沙姆(John Grisham)、喬治·馬丁(George R.R. Martin)和喬迪·皮考特(Jodi Picoult)在內的一批美國著名作家聯手起訴OpenAI,指控其使用他們的作品訓練ChatGPT侵犯了版權。去年7月,兩位作家對OpenAI提起了類似的訴訟,聲稱他們的書籍在未經同意的情況下被用於訓練該公司的聊天機器人。

在圖像生成領域,去年2月,Getty Images對Stability AI提起訴訟,指控後者複製了1200萬張Getty的圖片用於訓練數據。而在去年1月,Stability AI、Midjourney和DeviantArt也因其AI圖像生成器侵犯版權而遭到了集體訴訟。(小小)