工研院打造首座AI測試實驗室 語言模型可信任評測

圖說:工研院打造臺灣首座針對語言模型評測的AI測試實驗室,左起工研院量測技術發展中心業務長吳登峻、國家資通安全研究院總監劉建良、數位發展部數位產業署技正彭成瑜、工研院量測技術發展中心執行長藍玉屏、工研院資訊與通訊研究所組長王邦傑、工研院量測技術發展中心數位長陳宗傑。

隨著生成式AI應用範圍日益拓展,數位科技正在重新塑造我們的生活與商業模式,語言模型作為其重要核心,相關資安、準確性等問題,也是產業關心的重要議題。為確保AI人工智慧更安全的發展,提升人民對AI的信賴,在數位發展部數位產業署支持下,工研院今(29)日宣布打造臺灣首座AI測試實驗室,全方位確保產業客戶的語言模型能安全可靠的在各個領域穩定運行。

語言模型是自然語言處理(NLP)不可或缺的關鍵,也是AI人工智慧理解文本、生成內容、語音辨識、情感分析等重要依據,經由大規模文本學習來掌握語法、語意、上下文關聯性等語言特徵,進而產生類似人類的自然語言。然而,模型也可能因為數據偏差或失真,導致產生錯誤或不當資訊,甚至在處理敏感數據時更有資安風險存在。因此,儘管生成式AI當紅,但語言模型的開發和部署還是得小心謹慎,以確保輸出結果準確、穩定且可靠。

在數發部數產署支持下,工研院成立臺灣首座AI測試實驗室,參考國際可信賴AI的相關框架及標準,透過AI產品與系統評測中心(Artificial Intelligence Evaluation Center;AIEC)專家以及技術委員會開發可信任語言模型評測工具,提供包括準確性、公平性、可靠性、隱私及資安等自動化語言模型測試方案,協助國內廠商評估及改善語言模型,以確保語言模型及AI應用能在不同場景下保持穩定及可靠,並滿足企業和使用者需求。

工研院量測技術發展中心執行長藍玉屏表示,隨著生成式AI滲透到各個領域,對AI模型進行可信任性的測試與評估至關重要,因此工研院打造針對語言模型提供評測工具開發和導入的AI測試實驗室,透過參考國際以及國內專家審議的測試題庫,來評估生成內容的可信任性,促進企業在應用AI技術時更具信心。未來,跟隨AI應用更進一步拓展,工研院將持續加強對AI技術的測試和把關,並探索新興技術應用的測試與評估,確保臺灣在全球AI技術競爭中的發展。此外,為了強化國際合作,工研院也同時與法國國家計量院(LNE)簽署合作協議,針對AI進行國際合作與技術交流,助力臺灣AI評測技術接軌國際。

回到頂端