百度发布即时翻译“人工制品”,以突破自然语言处理的主要困难

新华社北京10月24日电在人工智能领域,两种语言的“实时翻译”是一个技术难题,这主要是由于源语言和目标语言之间存在较大的词序和词序差异。最近,百度开发了一个具有预测能力和可控延迟的实时机器翻译系统,可以实现高质量、低延迟的两种语言之间的翻译。这是自然语言处理领域的重大技术突破,将极大地推动机器实时翻译的发展。

同声传译机器利用语音识别技术自动识别说话人的语音内容,将语音转换为文本,然后调用机器翻译引擎将文本翻译成目标语言,显示在大屏幕上或通过语音合成。与人工翻译相比,机器最大的优点是不会因疲劳而降低翻译率。他们可以翻译所有“听到的”句子,这使得机器的“翻译率”达到100%,远远高于人类翻译人员的60%-70%。同时,百度在价格上也有优势

推出了语音识别、翻译质量、延迟和融合领域知识的一揽子解决方案。p>

在语音识别方面,与传统的上下文相关建模技术不同,百度提出了一种上下文无关音素组合的汉英混合建模单元,包含1749个上下文无关汉语音节和1868个上下文无关英语音节。该方法具有泛化性能好、抗噪声能力强、中英文混合识别等特点。在翻译质量方面,提出了一种“语音容错”的对抗性训练翻译模型。根据语音识别模型的常见错误,在训练数据中加入噪声数据,使模型能够在翻译过程中纠正错误的语音识别结果。例如,语音识别系统错误地将“大堂”识别为“大堂”,这对噪声词将自动包含在训练数据中,并将源语言句子“让我们在酒店大堂见面”替换为“让我们在酒店大堂见面”,在保持目标语言翻译不变的同时,使用两个中文句子进行训练,以获得容错性更强的模型

为了减少时间延迟,提高翻译质量,人类翻译人员通常会对语音内容进行合理的预测。百度开发者从人类翻译人员那里得到启发,开发了一个“wait-k单词”模型,可以根据历史信息直接预测翻译中目标语言的词汇。该模型在翻译质量和翻译延迟之间取得了很好的平衡。用户可以根据实际需要设置延迟时间(例如延迟1(k=1)字或延迟5(k=5)字)。例如,可以将其设置为低于西班牙语的级别;然而,对于差异较大的语言,如英语和汉语,以及语序不同的语言,如英语和德语,延迟应设置为更高的级别,以更好地处理差异

经常遇到不同领域的专业知识。这就要求同一批人才在短时间内吸纳大量相关领域的人才,这对他们来说也是一个巨大的挑战。基于此,百度提出了一种基于人类同声传译准备过程的快速领域知识整合策略。该策略依托百度海量互联网大数据培养具有通用翻译能力的模式;当接收到某一领域的同声传译任务时,系统会在通用模型的基础上收集该领域的数据并加强训练,并在相应领域中增加一个强大的模型。最后,对该领域的术语库进行强制解码,使专业术语的翻译准确可靠,提高翻译效率

的稀缺性也成为了一个棘手的问题。同声传译和同声传译是全世界开发人员面临的一个日益严重的问题。百度还希望通过开发高质量的机器、同声传译技术和系统来解决即时翻译的问题。P>

虽然该机器在同声传译方面有了新的突破,但与经验丰富的同声传译人员相比仍有一定差距。同声传译不是代替人工译员的同声传译,而是旨在降低同声传译的成本,使同声传译的应用更加广泛。百度希望与世界各地的人工智能实现无障碍沟通。p>

发表评论

您的电子邮箱地址不会被公开。

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据