Meta 开源了语言翻译 AI 模型

作者: Rishabh Moharir 译者: fenglyulin

| 2022-07-10 11:22:00   评论: 3

Meta 的 “ 不落下任何语言 No Language Left Behind ” 是一个宏大的开源项目,旨在以最高准确度翻译语言。

meta

Meta(前身是 Facebook)在开源世界做出了不小的贡献。Meta 除了专注于 元宇宙 Metaverse 和其社交媒体平台外,还致力于各种研究和创新工作,比如 React(一个 JaveScript 库)。

现在,Meta 的研究人员决定开源一个叫 “ 不落下任何语言 No Language Left Behind ” 项目。

(LCTT 校注:这个直译项目名称不够好听,我来抛砖引玉,似可称做“无人独语”,读者有什么建议吗?)

Meta 试图不落下任何语言

目前,虽然世界上有大约 7000 个在使用中的语言,但大多数在线的内容都是以少数的流行语言来提供的,比如英语。这让许多不懂这些语言的人处于不利的地位。

虽然现存的许多翻译工具,但语法错误会让错误变得难以阅读和理解。另外,如果你想把内容翻译为一个不流行的语言(特别是非洲和亚洲的一些语言),翻译体验不会很好。

因此,Meta 正在开发有最高质量的翻译工具,可以帮助解决这一全球性的问题。

NLLB-200( 不落下任何语言 No Language Left Behind ) 是一个人工智能翻译模型,其可以翻译 200 多种语言。该模型在每种语言中的翻译结果是通过一个名为 FLORES-200 复杂数据集来确定和评估的。

正如 Meta 所说,NLLB 的翻译结果比以前的人工智能研究方法好 40% 。对于一些最不常见的语言,其翻译准确率甚至超过 70%。了不起的工作!

为了帮助开发项目和提高模型的翻译质量,Meta 向所有感兴趣的研究人员开放了源代码,包括 NLLB-200 模型、FLORES-200 数据库、模型训练和重建训练数据库的代码。

你可以在 GitHub 上找到源代码,并且可以在该项目的 博客 上了解它的更多信息。

对社会事业的鼓励

Meta 宣布向从事 联合国可持续发展目标 UN Sustainable Development Goals 任何领域工作和翻译非洲语言的非营利组织和研究人员提供高达 20 万美元的捐赠,也鼓励其他学术领域如语言学和机器翻译的研究人员申请。

项目的影响

尽管 Meta 主要打算在其数字平台上,特别是在“元宇宙”上使用 NLLB,但 NLLB 也有可能在其他领域产生巨大影响。

许多用户可以用他们的母语轻松地访问和阅读在线资源。项目开源后,社区应该能够帮助实现这个目标。

你对 Meta 的这个项目有什么看法?



最新评论

来自广东深圳的 Firefox 104.0|GNU/Linux 用户  2022-08-24 04:27
这对人工翻译来说将是灭顶之灾
来自以色列的 Chrome 103.0|Windows 10 用户  2022-07-12 21:41
“无人独语”好隐晦,看不太懂。

“无语不成译”会不会好些?
来自美国的 Chrome Mobile 97.0|Android 10 用户  2022-07-10 18:11
个人觉得挺好的。虽然我不喜欢Meta公司,但是这个开源项目对于机器翻译以至于NLP领域的贡献很大。项目成熟后,对普通用户来说,就可以无需任何外语的学习浏览外文网站,结合模式识别技术,甚至可以做到十分精准的同声翻译,未来可期啊

友情链接
返回顶部