日期:2022/10/20

臉書(Facebook)母公司Meta打造人工智慧(AI)技術翻譯系統,讓使用閩南語(台語)人士能與使用英語者對話。這項新技術的幕後推手之一,是來自台灣的Meta軟體工程師陳鵬仁,希望父親能用最熟悉的台語跟所有人溝通。

Meta發布新聞稿指出,在台灣長大、講中文的陳鵬仁深深了解語言障礙將影響溝通能力,他的父親陳聖獎是一位70歲、退休的工廠技術主管,來自閩南語普遍使用的台灣南部。雖然閩南語與中文這2種語言相關,仍有許多不同,讓陳鵬仁的爸爸常覺得用中文進行複雜的對話非常困難。

Meta表示,目前為止,AI翻譯主要著重於各種書寫語言,但在全球超過7000種的現存語言中,有近半數主要以口語表達,沒有標準或廣泛使用的書寫文字系統。這導致Meta無法使用標準技術為這類語言打造機器翻譯工具,因為標準技術需有大量的書寫文字來訓練AI模型。

Meta著手打造閩南語翻譯系統時,面臨的一個重大障礙,是能否蒐集足夠資料。Meta利用中文作為中間語言,以建立偽標籤和人工翻譯,也就是先將英語或閩南語語音翻譯成中文文字,接著再翻譯成閩南語或英語,並新增至訓練資料中。這個方法利用資源充足的相似語言的資料,大幅改善模型成效。

Meta認為,AI研究有助於打破在現實世界和元宇宙中的語言限制,未來所有語言無論是否可以書寫,都不再是阻礙人們相互理解的障礙,期待為未來順暢無阻的溝通持續貢獻。

 
meta工程師陳鵬仁。來源:截圖自Meta網站

|原文網址|