☰

工研院首座「AI測試實驗室」登場提供語言模型可信任評測

首座「AI測試實驗室」提供語言模型可信任評測服務。圖／工研院提供

隨着生成式AI應用範圍日益拓展，數位科技正在重新塑造我們的生活與商業模式，語言模型作爲其重要核心，相關資安、準確性等問題，也是產業關心的重要議題。爲確保AI人工智慧更安全的發展，提升人民對AI的信賴，在數位發展部數位產業署支持下，工研院29日宣佈打造臺灣首座AI測試實驗室，全方位確保產業客戶的語言模型能安全可靠地在各個領域穩定運行。

語言模型是自然語言處理（Natural Language Processing；NLP）不可或缺的關鍵，也是AI人工智慧理解文本、生成內容、語音辨識、情感分析等重要依據，經由大規模文本學習來掌握語法、語意、上下文關聯性等語言特徵，進而產生類似人類的自然語言。然而，模型也可能因爲數據偏差或失真，導致產生錯誤或不當資訊，甚至在處理敏感數據時更有資安風險存在。因此，儘管生成式AI當紅，但語言模型的開發和部署還是得小心謹慎，以確保輸出結果準確、穩定且可靠。

在數發部數產署支持下，工研院成立臺灣首座AI測試實驗室，參考國際可信賴AI的相關框架及標準，透過AI產品與系統評測中心（Artificial Intelligence Evaluation Center；AIEC）專家以及技術委員會開發可信任語言模型評測工具，提供包括準確性、公平性、可靠性、隱私及資安等自動化語言模型測試方案，協助國內廠商評估及改善語言模型，以確保語言模型及AI應用能在不同場景下保持穩定及可靠，並滿足企業和使用者需求。

工研院量測技術發展中心執行長藍玉屏表示，隨着生成式AI滲透到各個領域，對AI模型進行可信任性的測試與評估至關重要，因此工研院打造針對語言模型提供評測工具開發和導入的AI測試實驗室，透過參考國際以及國內專家審議的測試題庫，來評估生成內容的可信任性，促進企業在應用AI技術時更具信心。未來，跟隨AI應用更進一步拓展，工研院將持續加強對AI技術的測試和把關，並探索新興技術應用的測試與評估，確保臺灣在全球AI技術競爭中的發展。此外，爲了強化國際合作，工研院也同時與法國國家計量院（LNE）簽署合作協議，針對AI進行國際合作與技術交流，助力臺灣AI評測技術接軌國際。

工研院擘畫「2035技術策略與藍圖」發展「人工智慧與資安」、「半導體晶片」、「通訊」、「智慧感測」等四大智慧化致能技術，協助我國各產業在AI人工智慧領域持續發展，並推動技術創新，此次AI測試實驗室的成立更是重要支柱，透過嚴謹的測試與評估，爲我國AI技術發展提供穩固基石，推動臺灣科技向更高層次邁進。

工研院首座「AI測試實驗室」登場 提供語言模型可信任評測

相關資訊

工研院首座「AI測試實驗室」登場提供語言模型可信任評測