隨著人工智慧(AI)技術快速發展,科技浪潮席捲全球,語料(Corpus)已成為數位時代的重要資源,從語音辨識、智慧翻譯,到生成式AI的應用,背後都皆仰賴大量而完整的語料庫做為基礎。對馬祖而言,推動馬祖語料蒐集、建置與利用,不僅是文化傳承,更是馬祖在AI時代轉型升級的關鍵基石。
馬祖母語流失情形日益嚴重,目前馬祖大多數年輕世代的馬祖話程度已是會聽不會說,對於較深的用語更是已逐漸失去理解能力,若不採取更具前瞻性的保存方法,未來恐怕只能在文獻與記憶中追尋馬祖話的聲音。行政院於111年核定「國家語言整體發展方案」,文化部根據該方案規劃從111年至115年分三期建置「馬祖語語料庫」,縣府也大力支持推動相關馬祖語料蒐集建置工作。目前馬祖語料庫第一期計畫已完成40小時口語語料蒐集,累積逾萬筆詞項,第二期更持續擴充至70小時以上,語料涵蓋飲食、服飾、宗教、歷史文化、戲曲歌謠及日常生活等十類主題。馬祖語料庫的建置,不僅保存馬祖話語音與文字,更標誌著馬祖語從「傳統保存」邁向「科技應用」層面前進。
馬祖語語料建置只是第一步,更重要的是後續的利用。若馬祖語料只是靜態地封存於伺服器中,未能轉化進入教育、觀光與生活應用領域,其價值未能充分發揮,十分可惜。面對AI浪潮,我們應進一步思考如何將馬祖話語料結合科技,讓馬祖話被聽見、被傳承、被使用。
我們可透過AI與馬祖語料發展數位學習資源,透過語料庫建立標準發音、詞彙與語句範例,搭配影音互動教材,讓學生能以更生活化方式接觸馬祖語。未來甚至可結合AI語音辨識技術,發展馬祖語發音練習系統,協助學生即時修正發音與得到回饋,提高學習效果,將原本硬梆梆的語言教材能化身為生動的數位學習,讓馬祖母語自然融入年輕一代的數位生活中。
我們也應積極推動馬祖語料AI應用研發。現今生成式AI工具快速發展,其關鍵就在於龐大語料支撐,我們應投入資源,積極鼓勵研究單位、科技團隊及地方文化工作者共同合作,推動馬祖語料運用開發,進一步強化馬祖語在智慧翻譯、語音助理及智慧導覽等領域的利用。
期待中央與地方持續合作,也期盼更多鄉親共同參與,強化馬祖語料蒐集、建置與利用,讓馬祖語結合人工智慧應用於生活與產業各個領域,在AI時代中創造馬祖更多可能。
社論/迎接AI時代 強化馬祖語料蒐集、建置與利用
- 2026-05-18