基于并行语料库的神经机器英语翻译方法研究

作者:王 晶,赵 彩 (西安交通大学城市学院)

摘 要:针对传统神经机器英语翻译依赖大规模、高质量平行语料库资源,导致对语料匮乏的英语内容翻译质量 不理想的问题,研究提出一种基于边缘分布估计的半监督神经机器英语翻译方法。 该方法的基本思想是首先通过全 概率公式计算并最大化平行语料与单语语料的似然,然后采用重要性采样的方法解决全概率公式计算中期望值搜索 空间较大的问题,确保目标函数的有效性。 最后,研究在英语-中文翻译任务上对提出的翻译方法进行仿真实验,结 果表明,提出的基于边缘分布的半监督神经机器英语翻译方法翻译效果良好,翻译质量优于基于平行语料的预训练 基准系统、基于语言模型浅度融合的神经机器翻译方法等其他半监督神经机器翻译方法。

关键词:平行语料;神经机器翻译;半监督学习;边缘分布估计

(来源: 自动化与仪器仪表 2021年第8期)

关注我的你,是最香哒!

发表评论

您的电子邮箱地址不会被公开。

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据