臺灣發展主權AI 林之晨給建言:先做繁中資料庫

電信三雄董、總今日下午至數發部拜會部長黃彥男,臺灣大總經理林之晨建議,數發部可以彙集政府、民間力量建置高品質「繁體中文共同資料庫」,爲主權AI發展奠定基礎。記者馬瑞璇/攝影

各國主權AI(人工智慧)意識興起,臺灣具備強勁AI硬體制造能力之外,更該發展主權AI,才能讓臺灣AI發展能力超前。電信三雄董、總今(18)日拜會新任數發部長黃彥男,除了談打詐、阻詐議題之外,臺灣大總經理林之晨也建議,數發部可以彙集政府、民間力量建置高品質「繁體中文共同資料庫」,爲主權AI發展奠定基礎。

電信三雄董、總今日下午至數發部拜會部長黃彥男,由擔任電信協會理事長的中華電信董事長郭水義帶隊,中華電信董事長郭水義、總經理林昭陽,臺灣大董事長蔡明忠、總經理林之晨,遠傳董事長徐旭東、總經理井琪均全都出席,今日會議中討論了打詐、防詐、主權AI(人工智慧)等議題。

輝達執行長黃仁勳今年二月在杜拜世界政府高峰會發表演說時,就提倡過主權AI概念,他呼籲各國應利用自己本國的基礎設施、數據、人力,產出自己的AI,以滿足自己國家的需求和目標。黃仁勳認爲,主權AI不僅可以增強國家的科技創新能力,也用來保護、推廣本國文化、語言和知識。

林之晨指出,臺灣數位發展進入到「換檔期」,過去一、兩年,臺灣幾個重要的數位產業,不管是電子商務、數位廣告、數位訂閱制,年成長都已經降到10%,電商這幾季甚至都只有個位數成長。

「數位發展部門現在很重要,要啓動整個數位產業發展,AI是個關鍵。」林之晨表示,臺灣現在的AI產業發展關鍵,卡在沒有自己的繁體中文共同資料庫(common data set),「ChatGPT、Gemini,雖然都講繁體中文,但它們講的繁體中文都怪怪的,因爲它吃的語料不是我們臺灣的語料。」

林之晨指出,AI工作有90%是資料整理、10%是訓練AI,對於英語系AI模型來說,因爲英語世界有許多共同資料庫,因此,大衆在使用Gemini、ChatGPT等生成式AI時,會覺得這幾種生成式AI的表現都差不多,「臺灣目前問題是沒有共同資料庫,如果沒有高品質的繁中資料庫,根本訓練不出來主權AI。因此,我今天跟部長建議,要集合政府甚至民間力量去把繁中共同資料庫做出來。」

對於林之晨所提建議,數發部長黃彥男也認同主權AI發展的重要。黃彥男也表示,接下來,開發繁體中文共同資料庫將會是多元創新司的其中一個任務,未來,也希望能有機會跟電信業者一起合作。