中研院AI稱領導人是習近平遭下架 廖俊智:事後才知道

中研院開發的繁體中文語言模型AI,日前經網友實測提問卻回覆「我的國籍是中國」,引發議論,中研院院長廖俊智今天表示,研究員已深切反省,中研院也已學到正面教訓,除趕緊下架測試版,也將成立「生成式AI風險研究小組」,避免類似事件再度發生。記者胡經周/攝影

中研院上週釋出了類似CHAT GPT的大型語言模型CKIP-Llama-2-7b,並將其放上公開平臺提供學術和商用。卻被使用者踢爆採用簡體中文版的資料庫,導致使用者詢問「國家領導人是誰」,得到「習近平」的答案。中研院發現出包後,三天內便將此一語言模型下架。中研院院長廖俊智今赴立院業務報告時,多位立委詢問此事,廖俊智坦承是該研究員「求好心切」自行發佈試用版本,他也是「事後才知道」。

立委萬美玲指出,此一模型語言模型經網友測試,回答我國最高領導人是習近平,並自述是由復旦大學自然語言處理實驗室和上海人工智能實驗室共同開發,居住地在上海人工智能實驗室服務器集,「這是抄襲對岸研究成果?」

廖俊智迴應,、CKIP模型(CKIP-Llama-2-7b)爲中研院個別研究人員主持的詞庫小組(CKIP)的實驗性研究,模型尚在測試階段,該名研究員「求快心切」自行發佈試用版本,他也是事後才知情。

繁體中文語料庫是發展臺灣大型語言模型的重要基礎,中研院也準備整合繁體中文詞知識庫,投入資源並規劃管理機制。此一出包的CKIP模型屬中研院內部計劃,目的是要協助研究人員自動化分析和建構中國明清朝代人物的生平圖譜。廖俊智表示,該研究員先拿到30萬經費做測試,但此一經費不足以搭建繁體中文詞庫,因此先找了大陸的簡體版詞庫來測試。

中研院日前已發表聲明,相當重視此事件對社會的影響,將釐清事件是否違反相關規定。後續將規劃成立「生成式AI風險研究小組」,深入瞭解AI對社會的衝擊,提供研究人員相關指引,避免類似事件再度發生。但萬美玲表示,此一風波代表中研院「螺絲鬆了」,認爲中研院研究員的研究一但公開便代表中研院,此一系統三天就下架,中研院鬧了笑話。

立委黃國書指出,中研院目前有六個計劃跟「生成式AI」有關,經費達一千多萬。廖俊智表示,據他了解,這六個計劃並未使用中國大陸的資料庫,他保證會跟相關計劃的研究員提醒。

至於發展「臺版ChatGPT」,廖俊智表示, 國科會正整合國內學研力量並與業界合作,打造可信任生成式AI對話引擎「TAIDE」,中研院很多研究員參與此一計劃。

立委陳培瑜則擔心,生成式AI在歐美引發許多版權問題,中研院對此是否有所準備。中研院迴應,AI版權問題目前仍在法律釐清的階段。

延伸閱讀