唐鳳:AI評測中心5指標可自動化驗測 是否收費待討論

唐鳳18日率隊視察AI產品與系統評測中心,並於致詞時提到,AI評測就很像身體檢查,對尚待改善之處改善,而生成式AI很不同,只要社會告訴它有甚麼期待,就可以透過模型訓練,做到對齊;而透過審議式調查,將維持資訊完整性跟安全性。未來數位部將確保AI技術發展跟社會對齊,朝向安全發展邁進。

數位部產業署副署長林俊秀致詞時則說,AI評測中心最主要目的,就是降低衝擊跟因應挑戰,首年會跟語言模型結合,並訂出十項評測項目,其中公平、準確、可靠、隱私和資安等五大項,可以進行自動測式。

林俊秀也提到,這是世界首創的,臺灣也很願意跟國際交流,希望可以將該評測送上國際舞臺。

對於今年預計何時可以開始有比較大規模送測?唐鳳說,現在都已經看到示範,包含測試題庫題型等等,現在有意願送測的廠商其實隨時都可以跟我們來索取,只要開得出跟測試機構相符合的應用程式介面(API),就可以開始自動測試的部分。

唐鳳說,目前十項測項已有五項可以開始自動測試,當然有一些包含對社會安全等等,都還需要用一些人工或甚至是審議式調查,把大家所有人的願望或者是偏好先蒐集起來再進行測試,但是能夠自動化測試的部分現在就可以開始了。

對於目前送測的件數,唐鳳說,想借着今天的這個機會告訴大家說已經可以正式來提出申請,之前就是願意瞭解測試方向的幾家大的AI模型的公司,大概都有向數位部表示興趣。惟唐鳳也說,硬體效能並不是測試的範圍。

唐鳳強調,把包含自動化的驗測總計十項都融合到同一個產品跟系統,來進行評測的中心,這是全球首創的,當然在大部分的AI的開發實驗室裡面,也是有可以全自動測試,或是說透過一些民調或審議的方法來蒐集社會的意見。惟臺灣首創的部分,是用同一個中心來同時做這兩部分的事情。

針對收費問題,唐鳳說,制度的部分,會由審議委員會來進行討論,時間上會盡快來召開。

唐鳳說,AI評測中心有點像拋磚引玉,未來如果有更快速驗測方式,就是民間可以共襄盛舉地方。

唐鳳說,臺灣在AI評測這件事情上面,是跟世界最先進國家互相接軌,無論是美國、歐洲、歐盟或是英國,現在大家都在找出怎麼樣快速讓這些生成式的AI在走入社會的時候,能夠符合社會的期待;此外,當社會的期待有所改變、有新的期待的時候,怎麼樣快速對齊、快速重新訓練這些模型,讓它能夠符合每個不同的社會的期待,很幸運臺灣能夠去跟全世界正在研究這件事。相信組成的AI評測體系,可以協助各行各業導入生成式AI的時候,保持它既安全然後又注重到這個社會,包含隱私人權等等重要的價值。