臺灣做主權AI 林之晨:打造繁中資料庫

電信三雄董、總至數發部拜會部長黃彥男,臺灣大總經理林之晨建議,數發部可以彙集政府、民間力量建置高品質「繁體中文共同資料庫」,爲主權AI發展奠定基礎。記者馬瑞璇/攝影

各國主權AI(人工智慧)意識興起,臺灣具備強勁AI硬體制造能力之外,更該發展主權AI,才能讓臺灣AI發展能力超前。電信三雄董、總昨拜會新任數發部長黃彥男,除了談打詐、阻詐議題之外,臺灣大總經理林之晨也建議,數發部可以彙集政府、民間力量建置高品質「繁體中文共同資料庫」,爲主權AI發展奠定基礎。

電信三雄董、總昨日下午至數發部拜會部長黃彥男,由擔任電信協會理事長的中華電信董事長郭水義帶隊,中華電信董事長郭水義、總經理林昭陽,臺灣大董事長蔡明忠、總經理林之晨,遠傳董事長徐旭東、總經理井琪均全都出席,會議中討論了打詐、防詐、主權AI(人工智慧)等議題。

輝達執行長黃仁勳二月在杜拜世界政府高峰會發表演說時,就提倡過主權AI概念,認爲主權AI不僅可以增強國家的科技創新能力,也用來保護、推廣本國文化、語言和知識。

林之晨指出,臺灣數位發展進入到「換檔期」,過去一、兩年,臺灣幾個重要的數位產業,不管是電子商務、數位廣告、數位訂閱制,年成長都已經降到一成,電商這幾季甚至都只有個位數成長。

「數位發展部門現在很重要,要啓動整個數位產業發展,AI是個關鍵。」林之晨表示,臺灣現在的AI產業發展關鍵,卡在沒有自己的繁體中文共同資料庫(common data set),「ChatGPT、Gemini,雖然都講繁體中文,但它們講的繁體中文都怪怪的,因爲它吃的語料不是我們臺灣的語料」。

林之晨指出,AI工作有九成是資料整理、一成是訓練AI,對於英語系AI模型來說,因爲英語世界有許多共同資料庫,因此,大衆使用Gemini、ChatGPT等生成式AI時,會覺得表現都差不多,「如果沒有高品質的繁中資料庫,根本訓練不出來主權AI。因此,跟部長建議,要集合政府甚至民間力量去把繁中共同資料庫做出來」。

數發部長黃彥男也認同主權AI發展的重要。並表示,開發繁體中文共同資料庫將會是多元創新司的其中一個任務,未來,也希望能有機會跟電信業者一起合作。