
記者吳文欽/高雄報導
近日跨境電商爆發個資外洩,目前除第三方鑑識完成外,數發部也已進入行政調查程序。民進黨立委李昆澤在立法院交通委員會質詢上,促請數發部必須妥適處理,盡速向國人報告本案個資外洩狀況。
李昆澤指出,在數位主權發展方面,目前台灣主權AI的語料庫規模約十一億個Token,數字看起來龐大,但相較於國際主流模型動輒「兆級」的規模,台灣仍需要追趕。
除了量需要加強,在質的方面,李昆澤也提醒數發部在資料庫的建置上,需要多多納入對台灣民間社會、文學脈絡與生活溫度的理解。
李昆澤認為,面對簡體中文語料的強力滲透,我們若無法補足高品質的繁體中文語料,台灣的數位主權將名存實亡,甚至在不知不覺中被他國的價值觀「數位殖民」。
李昆澤強調,在全球AI競速的戰場上,各國都在爭奪文化詮釋權與數位主權,台灣主權AI的發展需要政府的投入,也需要民間重要文化資本的合作。
