神经机器模型能翻译200种语言

发布时间: 2024-06-06 17:36:35 来源：科技日报

观看：204

《自然》5日发表的一篇论文报道了一个Meta人工智能（AI）模型的底层技术。该模型能翻译200种不同语言，增加了机器翻译的语言数量。

神经机器翻译模型利用人工神经网络翻译各种语言。这些模型通常需要大量可在线获取的数据加以训练，但并非所有语言数据都是公开、低成本或是普遍可及的，这类语言被称为低资源语言。一味地增加模型翻译语言数量，可能会影响模型的翻译质量。

此次，Meta的法国研究团队和“不落下任何语言”（NLLB）团队开发了一种跨语言技术，能让神经机器翻译模型学习如何利用翻译高资源语言的预存能力，实现对低资源语言的翻译。研究团队开发了一个在线多语言翻译工具，名为“NLLB-200”。该工具能容纳200种语言，其低资源语言数量是高资源语言数量的3倍，翻译表现则比当今已有系统高44%。

由于团队在许多低资源语言上只能获取1000—2000例样本，为了扩大“NLLB-200”的训练数据量，他们用一个语言识别系统发现了这些特定语言的更多实例。团队还从互联网存档中挖掘双语文本数据，帮助提升其翻译质量。

研究团队指出，这个工具可以帮助很少被翻译的那些语言的使用者，让他们也能用上互联网和其他技术。此外，教育是一个非常重要的应用，因为这个模型可以帮助低资源语言使用者获取更多图书和研究文章。但团队也表示，目前误译的情况仍有可能出现。

《自然》5日发表的一篇论文报道了一个Meta人工智能（AI）模型的底层技术。该模型能翻译200种不同语言，增加了机器翻译的语言数量。

神经机器翻译模型利用人工神经网络翻译各种语言。这些模型通常需要大量可在线获取的数据加以训练，但并非所有语言数据都是公开、低成本或是普遍可及的，这类语言被称为低资源语言。一味地增加模型翻译语言数量，可能会影响模型的翻译质量。

此次，Meta的法国研究团队和“不落下任何语言”（NLLB）团队开发了一种跨语言技术，能让神经机器翻译模型学习如何利用翻译高资源语言的预存能力，实现对低资源语言的翻译。研究团队开发了一个在线多语言翻译工具，名为“NLLB-200”。该工具能容纳200种语言，其低资源语言数量是高资源语言数量的3倍，翻译表现则比当今已有系统高44%。

由于团队在许多低资源语言上只能获取1000—2000例样本，为了扩大“NLLB-200”的训练数据量，他们用一个语言识别系统发现了这些特定语言的更多实例。团队还从互联网存档中挖掘双语文本数据，帮助提升其翻译质量。

研究团队指出，这个工具可以帮助很少被翻译的那些语言的使用者，让他们也能用上互联网和其他技术。此外，教育是一个非常重要的应用，因为这个模型可以帮助低资源语言使用者获取更多图书和研究文章。但团队也表示，目前误译的情况仍有可能出现。

3月18日，中国经济信息社（以下简称中经社）垂直领域数字化应用系统发布仪式在北京举行。在发布仪式上，锚定建设“国家级经济信息旗舰”的目标，中经社推出了八大数字化应用系统。中经社此次发布的行未来的足球场，人工智能（AI）当“大脑”？《自然·通讯》19日发表一项来自谷歌深度思维的最新成果，研究团队报告了一个名为“TacticAI”的系统，能在足球比赛中预测角球结果并提供实际且准确的战 3月21日是第二十五个“世界睡眠日”，中国睡眠研究会联合慕思集团在北京正式发布《2024情绪与健康睡眠白皮书》（以下简称《白皮书》）。《白皮书》指出，智能床垫运用算法将内在情绪与睡眠质量相关 xiaomi在3月21日正式发布了首款“潮流旗舰”定位的产品——xiaomiCivi 4 Pro。该机定位相较以前大幅升级，尤其是性能、影像、AI方面明显提高，这背后的大功臣之一就是第三代骁龙8s。xiaom 近日，民航华东地区管理局向峰飞科技公司颁发V2000CG无人驾驶航空器系统型号合格证，这也是中国民航系统颁发的首个无人驾驶吨级电动垂直起降航空器型号合格证。航空器型号合格证取证是保障航空记者从中国气象局了解到，3月24日、25日和26日三天，将可能出现地磁活动，其中3月25日可能发生中等以上地磁暴甚至大地磁暴，预计地磁活动将持续到26日。在此影响之下，空间站可能因大气拖拽造成轨道高。

本文链接：神经机器模型能翻译200种语言http://www.sushuapos.com/show-2-6683-0.html

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇： AI“帮”我还上这张电影票

下一篇：延缓老年运动能力下降的蛋白找到

神经机器模型能翻译200种语言

热门资讯

推荐资讯

科技最热文章