Meta 的人工智能可以翻译几十种资源匮乏的语言

LASER3 师生教学方法的架构。图片来源: 自然 (2024)。DOI:10.1038/s41586-024-07335-x

一篇论文描述了 Meta 的人工智能模型背后的技术,该模型可以翻译 200 种不同的语言 发布自然。该模型扩大了可通过机器翻译进行翻译的语言数量。

神经机器翻译模型利用人工神经网络来翻译语言。这些模型通常需要大量可在线访问的数据进行训练,而对于某些语言(称为“低资源语言”),这些数据可能不公开、不便宜或不常见。增加模型的语言输出(即其翻译的语言数量)可能会对模型的翻译质量产生负面影响。

Marta Costa-jussà 和 No Language Left Behind (NLLB) 团队开发了一种跨语言方法,该方法允许神经机器翻译模型学习如何利用其先前存在的翻译高资源语言的能力来翻译低资源语言。

因此,研究人员开发了一种名为 NLLB-200 的在线多语言翻译工具,它包含 200 种语言,其中低资源语言的数量是高资源语言的三倍,性能比现有系统高 44%。

由于研究人员只能访问许多资源匮乏的语言的 1,000-2,000 个样本,为了增加 NLLB-200 的训练数据量,他们利用语言识别系统来识别更多给定方言的实例。该团队还从互联网档案中挖掘了双语文本数据,这有助于提高 NLLB-200 提供的翻译质量。

作者指出,该工具可以帮助那些很少翻译的语言的人访问互联网和其他技术。此外,他们强调教育是一个特别重要的应用,因为该模型可以帮助那些说资源匮乏的语言的人获得更多的书籍和研究文章。然而,Costa-jussà 和合著者承认,误译仍可能发生。

更多信息:
将神经机器翻译扩展到 200 种语言, 自然 (2024)。 DOI: 10.1038/s41586-024-07335-x

由自然出版集团提供


引用:Meta 的 AI 可以翻译数十种资源匮乏的语言(2024 年 6 月 7 日)于 2024 年 6 月 7 日检索自

本文件受版权保护。除出于私人学习或研究目的的合理使用外,未经书面许可不得复制任何部分。内容仅供参考。

1717784152
#Meta #的人工智能可以翻译几十种资源匮乏的语言
2024-06-07 16:09:02

Leave a Reply

Your email address will not be published. Required fields are marked *

近期新闻​

编辑精选​