這款名為SEAMLESSM4T的AI模型 填補了語言覆蓋方面的空白
【記者李清華外電報導】國際知名學術期刊《自然》最新發表一篇人工智能(AI)研究論文稱,研究人員研發出一個AI模型,能即時翻譯多達101種語言的語音和文本,包括直接語音到語音翻譯。
這款名為SEAMLESSM4T的AI模型,填補了語言覆蓋方面的空白,並且性能優於現有的系統,研究團隊說,本項研究工作或可為快速通用翻譯鋪平道路,其資源公開可用(用於非商業用途),以協助進一步研究包容性語音翻譯技術。
該論文介紹,大多數現有的機器學習翻譯系統都是文本導向,或者需要語音識別、翻譯成文本、再將文本轉換成語音好幾步;此外,現有語音到語音模型的語言覆蓋範圍也遠低於文本到文本的模型,並且傾向於從源語言翻譯成英語,而非從英語到另一種語言。
為了解決這些限制,在本項研究中,美國Meta基礎AI研究的“無縫交流團隊”開發出一個單一模型SEAMLESSM4T,其支持多達101種語言之間的多種翻譯模式,可以支持語音到語音(識別101種語言並翻譯為36種語言)、語音到文本(101種語言譯為96種)、文本到語音(96種語言譯為36種)、文本到文本(96種語言)的翻譯,以及自動語音識別(96種語言)。
研究團隊表示,在語音到語音的翻譯中,SEAMLESSM4T的文本翻譯比現有系統准確率提升23%;同時,該AI模型可過濾背景噪音並適應說話者的差異。
《自然》同期發表同行專家的“新聞與觀點”文章指出,雖然後續還需要進一步優化,但AI模型SEAMLESSM4T可能代表著向跨越語言障礙促進交流的進步。
↑圖說:這款名為SEAMLESSM4T的AI模型能即時翻譯101種語言(供圖)
最新AI能即時翻譯101種語言
—