工研院打造首座AI測試實驗室　語言模型可信任評測

2024.10.29
文：Wa-People／李慧臻 Jane Lee
圖：Wa-People／編輯中心

圖說：工研院打造臺灣首座針對語言模型評測的AI測試實驗室，左起工研院量測技術發展中心業務長吳登峻、國家資通安全研究院總監劉建良、數位發展部數位產業署技正彭成瑜、工研院量測技術發展中心執行長藍玉屏、工研院資訊與通訊研究所組長王邦傑、工研院量測技術發展中心數位長陳宗傑。

隨著生成式AI應用範圍日益拓展，數位科技正在重新塑造我們的生活與商業模式，語言模型作為其重要核心，相關資安、準確性等問題，也是產業關心的重要議題。為確保AI人工智慧更安全的發展，提升人民對AI的信賴，在數位發展部數位產業署支持下，工研院今（29）日宣布打造臺灣首座AI測試實驗室，全方位確保產業客戶的語言模型能安全可靠的在各個領域穩定運行。

語言模型是自然語言處理（NLP）不可或缺的關鍵，也是AI人工智慧理解文本、生成內容、語音辨識、情感分析等重要依據，經由大規模文本學習來掌握語法、語意、上下文關聯性等語言特徵，進而產生類似人類的自然語言。然而，模型也可能因為數據偏差或失真，導致產生錯誤或不當資訊，甚至在處理敏感數據時更有資安風險存在。因此，儘管生成式AI當紅，但語言模型的開發和部署還是得小心謹慎，以確保輸出結果準確、穩定且可靠。

在數發部數產署支持下，工研院成立臺灣首座AI測試實驗室，參考國際可信賴AI的相關框架及標準，透過AI產品與系統評測中心（Artificial Intelligence Evaluation Center；AIEC）專家以及技術委員會開發可信任語言模型評測工具，提供包括準確性、公平性、可靠性、隱私及資安等自動化語言模型測試方案，協助國內廠商評估及改善語言模型，以確保語言模型及AI應用能在不同場景下保持穩定及可靠，並滿足企業和使用者需求。

工研院量測技術發展中心執行長藍玉屏表示，隨著生成式AI滲透到各個領域，對AI模型進行可信任性的測試與評估至關重要，因此工研院打造針對語言模型提供評測工具開發和導入的AI測試實驗室，透過參考國際以及國內專家審議的測試題庫，來評估生成內容的可信任性，促進企業在應用AI技術時更具信心。未來，跟隨AI應用更進一步拓展，工研院將持續加強對AI技術的測試和把關，並探索新興技術應用的測試與評估，確保臺灣在全球AI技術競爭中的發展。此外，為了強化國際合作，工研院也同時與法國國家計量院（LNE）簽署合作協議，針對AI進行國際合作與技術交流，助力臺灣AI評測技術接軌國際。

工研院打造首座AI測試實驗室　語言模型可信任評測

科技產業「人」與「事」。值得關注、鼓掌、感謝的 ......

關於

聯繫

產業人物 Wa-People 編輯中心

工研院打造首座AI測試實驗室 語言模型可信任評測

科技產業「人」與「事」。值得關注、鼓掌、感謝的 ......

關於

聯繫

產業人物 Wa-People 編輯中心

工研院打造首座AI測試實驗室　語言模型可信任評測