2023年03月27日

Meta AI看鄉土劇學台語 閩英翻譯即時通

(本報綜合報導)祖克柏10月19日在臉書發布短片,影片中祖克柏說英語,與一名說台語的男子對話,示範英語與閩南話語音互譯的成果。之後Meta發布新聞稿指出,這名說台語的男子,是在台灣長大的台灣工程師陳鵬仁。

祖克柏說英語 台灣人說台語 對話OK

Meta宣布建立一套人工智慧系統,可讓台灣常用的閩南話(台語)和英語互譯。影片中祖克柏先是宣布Meta有了這個新的技術,接著螢幕上出現一個華人面孔,以福建話說:「嗨,馬克(祖克柏的名字),你甘知影咱A團隊打造第一個支持口語語言的翻譯系統?」接著便聽見這段話的口說英語翻譯。

祖克柏以英語指出,有數以百萬的民眾說福建話,但因為它沒有標準的書寫系統,這使得打造翻譯系統變得很困難。這段話接著被譯成福建話唸出來。

推手是台灣工程師 盼父親溝通無礙

Meta發布新聞稿指出,在台灣長大、講中文的陳鵬仁深深了解語言障礙將影響溝通能力,他的父親是一位70歲、退休的工廠技術主管,來自閩南語普遍使用的台灣南部。雖然閩南語與中文這2種語言相關,仍有許多不同,讓陳鵬仁的爸爸常覺得用中文進行複雜的對話非常困難,陳鵬仁研究這項技術的初衷,便是希望父親能用最熟悉的台語跟所有人溝通。

以前的AI翻譯 是用文字再轉化為語音

Meta表示,AI翻譯主要著重於各種書寫語言,並使用大量的書寫文字來訓練AI模型,再轉化成語音,但在全球超過7000種現存語言中,將近半數主要以口語表達,沒有標準或廣泛使用的書寫文字系統,閩南語就是其中之一,這是機器翻譯的障礙。

Meta技術突破:AI像嬰兒直接學說話

參與研究團隊的台灣大學電機工程學系副教授李宏毅指出,Meta技術上的突破,在於讓機器透過大量沒有標註的資料「自監督學習」,就像是人類幼童學習母語,都是先大量聽人說話,在腦中形成一定的概念,等上學後老師提點一下,就能很快學會該語言的系統。另一項突破是「語音直接轉語音」,能減少錯誤傳遞,還能保留講話的情緒。

讓AI看了1500小時的台灣鄉土劇…

Meta也是先讓機器聽一大堆沒有文字標註的聲音,對語言有一定程度瞭解後,再給予一些「成對」資料提點,進而很快學會這種語言。台灣鄉土劇就是作為提點的關鍵角色之一,研究團隊收隻了1500小時的台灣鄉土劇資料,李宏毅解釋,鄉土劇最大的好處,在於除了有聲音訊號,還有文字字幕可以對照,這就是「成對」的資料,是非常好的教材。Meta也運用了Taiwanese Across Taiwan(TAT)的閩南語語音語料庫來訓練,幫助提高準確率。

壹哥:Meta已掌握翻譯關鍵技術?

YouTube頻道「壹哥的科技生活」主編壹哥表示,閩南語資料庫建置不易,從時間、人力、物力投入成本的角度來看,都是不符合成本的策略。以往美國公司的測試模組會偏好在比較大的市場進行,例如歐美、印度、加拿大、澳洲,這次卻從基數相對較少的閩南語出發,或許說明兩件事。

第一,Meta相當重視亞洲市場動能,包括在台灣投入一定的人力與相關資源;第二,Meta很可能已經掌握翻譯的關鍵技術,並且已經在做最終測試。

還在早期模型 實測速度慢、易出錯

不過,壹哥表示,實際測試Meta AI翻譯系統從閩南語轉英語、英語轉閩南語,發現失誤率偏高,且反應速度也比較緩慢,一句話明顯放慢速度念完,還可能出現翻譯錯誤。「不過對於早期的AI測試模型來說,這都是很司空見慣的情況。」

元宇宙撞破語言障礙指日可待

壹哥引述Meta的公開資料指出,這次的閩南語翻譯是透過中文當中介語言,進而在英語和閩南語之間轉換。換言之,未來如果想以英文當中介語言來翻譯許多地區的當地母語,相信也不是難事。

「這是一個相當有力的技術宣示。」壹哥認為,新的翻譯系統說明Meta透過AI形式,未來在元宇宙空間裡以使用者母語直接和外國人暢所欲言的情境,將指日可待。

延伸閱讀

LEAVE A REPLY

Please enter your comment!
Please enter your name here

訂閱168電子報

專欄文章