傳音AI翻譯團隊獲WMT 2021國際機器翻譯大賽非洲小語種方向冠軍

尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️

加入LINE好友

最近,由國際計算語言學協會(The Association for Computational Linguistics,ACL)舉辦的WMT 2021國際機器翻譯比賽結果揭曉。首次參加該項大賽的傳音AI翻譯團隊在「科薩語-祖魯語」雙向翻譯的賽道上斬獲機器自動評測冠軍,並在「孟加拉語-印地語」、「印地語-孟加拉語」翻譯任務的機器自動評測中分別獲得第二名、第三名的佳績。

傳音AI翻譯團隊獲WMT 2021國際機器翻譯大賽非洲小語種方向冠軍 科技 第1張

WMT大賽(Conference on Machine Translation)是全球頂級的機器翻譯評測比賽,在全球學術界、工業界享有盛譽。自2006年起,WMT大賽已成功舉辦16屆,每年都吸引了來自世界各地的頂級企業、高校和科研機構參賽,包括微軟、Facebook、騰訊、字節跳動、百度、金山等。

WMT 2021大賽共有72支實力雄厚的隊伍參賽,共計提交1308次譯文數據,競爭異常激烈。組委會按照在國際上具有廣泛認可度的BLEU自動評估指標對提交的機器譯文和標準答案進行擬合計算,擬合程度高者排在前面。傳音AI翻譯團隊經過多次角逐脫穎而出,成功占據「科薩語-祖魯語」雙向翻譯機器自動評測指標的榜首。

傳音AI翻譯團隊獲WMT 2021國際機器翻譯大賽非洲小語種方向冠軍 科技 第2張

傳音AI翻譯團隊獲WMT 2021國際機器翻譯大賽非洲小語種方向冠軍 科技 第3張

深耕AI翻譯領域,打造前沿研究、產品應用和用戶反饋閉環

傳音AI翻譯團隊在本次WMT 2021中主要面臨低資源語料的挑戰。為了更好能利用低資源語料,提升低資源機器翻譯的效果,傳音AI翻譯團隊採用自研的混合神經統計機器翻譯和機器翻譯(Hybrid-SNMT)。在模型上,Hybrid-SNMT首先應用N元語法得到向量,並統計對齊概率等方式得到各個詞庫和語言模型,再以此訓練雙向互譯的對偶NMT模型。在數據上,Hybrid-SNMT通過迭代回譯等方式,不斷提煉和豐富各個詞庫,並增廣數據。

在國際賽事中斬獲佳績與認可,得益於傳音AI翻譯團隊在人工智慧領域持續不斷的技術研究和產品體驗的打磨。傳音AI翻譯團隊基於神經網路機器翻譯技術,持續進行迭代,引⼊了前沿的機器翻譯算法,不斷創新算法和架構,提升翻譯能力。

目前,傳音翻譯已成為一個日翻譯數億字符的多語種機器翻譯引擎,支持多語種間的雙向翻譯,質量達到新興市場業界領先水平。在技術和數據的協同之下,傳音深度布局機器翻譯生態,服務場景已涵蓋社交對話翻譯、閱讀翻譯、傳音掃一掃等,同時還為傳音語言大師、傳音智能語音助手、Hi Translate、菲酷等提供翻譯服務支持,後續將陸續拓展更多應用場景。同時,通過海量的傳音智能終端用戶使用反饋,不斷提升、改進機器翻譯算法,打造「前沿研究-產品應用-用戶反饋」的完整閉環。

以洞察為基點,加速構建非洲智能翻譯服務體系

長期以來,傳音深耕以非洲為代表的新興市場,為消費者提供適切需求的智能終端產品和移動互聯服務。本次獲獎,正是傳音多維度市場洞察及本地化創新產品理念的最佳註腳。

在不斷提升的機器翻譯技術背後,是傳音深厚的語言基因。非洲大陸幅員遼闊,國家眾多,是世界上最龐雜、多樣化的地區之一,也是語言種類最多的大陸,許多當地民眾習慣使用本民族語言。以科薩語(Xhosa)及祖魯語(isiZulu)為例,兩者分別是科薩族和祖魯族的民族語言,同時也是南非共和國的官方語言。在南非,科薩語的使用人口分布最廣,而祖魯語的使用人數最多。傳音手機產品不僅支持英語、法語、阿拉伯語、西班牙語、葡萄牙語等官方語言或通用語,更支持多種非洲本地語言,包括阿姆哈拉語、奧羅莫語、提格雷語、索馬裡語、斯瓦希裡語、豪薩語等小語種,以滿足本地用戶的需求。

傳音AI翻譯團隊以技術為核心,結合非洲語言種類和使用格局,不斷延伸服務場景,創造性地進行非洲智能翻譯服務體系構建,為本地用戶帶來更便捷的溝通體驗。隨著傳音全球新興市場業務的不斷拓展,傳音AI翻譯團隊也加大了針對南亞、東南亞等其他新市場本地小語種的研究探索,不斷提升相應的翻譯能力。

未來,傳音將持續加大對人工智慧領域的學習與投⼊,積極將技術升級運用在產品之中,並基於傳音平臺生態帶來覆蓋更廣的應用場景,為新興市場用戶提供更優質的智能產品體驗。

About 尋夢園
尋夢園是台灣最大的聊天室及交友社群網站。 致力於發展能夠讓會員們彼此互動、盡情分享自我的平台。 擁有數百間不同的聊天室 ,讓您隨時隨地都能找到志同道合的好友!