工研院首座「AI測試實驗室」登場 提供語言模型可信任評測

首座「AI測試實驗室」提供語言模型可信任評測服務。圖/工研院提供

隨着生成式AI應用範圍日益拓展,數位科技正在重新塑造我們的生活與商業模式,語言模型作爲其重要核心,相關資安、準確性等問題,也是產業關心的重要議題。爲確保AI人工智慧更安全的發展,提升人民對AI的信賴,在數位發展部數位產業署支持下,工研院29日宣佈打造臺灣首座AI測試實驗室,全方位確保產業客戶的語言模型能安全可靠地在各個領域穩定運行。

語言模型是自然語言處理(Natural Language Processing;NLP)不可或缺的關鍵,也是AI人工智慧理解文本、生成內容、語音辨識、情感分析等重要依據,經由大規模文本學習來掌握語法、語意、上下文關聯性等語言特徵,進而產生類似人類的自然語言。然而,模型也可能因爲數據偏差或失真,導致產生錯誤或不當資訊,甚至在處理敏感數據時更有資安風險存在。因此,儘管生成式AI當紅,但語言模型的開發和部署還是得小心謹慎,以確保輸出結果準確、穩定且可靠。

在數發部數產署支持下,工研院成立臺灣首座AI測試實驗室,參考國際可信賴AI的相關框架及標準,透過AI產品與系統評測中心(Artificial Intelligence Evaluation Center;AIEC)專家以及技術委員會開發可信任語言模型評測工具,提供包括準確性、公平性、可靠性、隱私及資安等自動化語言模型測試方案,協助國內廠商評估及改善語言模型,以確保語言模型及AI應用能在不同場景下保持穩定及可靠,並滿足企業和使用者需求。

工研院量測技術發展中心執行長藍玉屏表示,隨着生成式AI滲透到各個領域,對AI模型進行可信任性的測試與評估至關重要,因此工研院打造針對語言模型提供評測工具開發和導入的AI測試實驗室,透過參考國際以及國內專家審議的測試題庫,來評估生成內容的可信任性,促進企業在應用AI技術時更具信心。未來,跟隨AI應用更進一步拓展,工研院將持續加強對AI技術的測試和把關,並探索新興技術應用的測試與評估,確保臺灣在全球AI技術競爭中的發展。此外,爲了強化國際合作,工研院也同時與法國國家計量院(LNE)簽署合作協議,針對AI進行國際合作與技術交流,助力臺灣AI評測技術接軌國際。

工研院擘畫「2035技術策略與藍圖」發展「人工智慧與資安」、「半導體晶片」、「通訊」、「智慧感測」等四大智慧化致能技術,協助我國各產業在AI人工智慧領域持續發展,並推動技術創新,此次AI測試實驗室的成立更是重要支柱,透過嚴謹的測試與評估,爲我國AI技術發展提供穩固基石,推動臺灣科技向更高層次邁進。