什么是NMT神经网络机器翻译?

神经网络机器翻译(Neural Machine Translation, NMT),就是通过使用计算机神经网络技术,利用人工智能模仿大脑神经元进行语言翻译。



NMT依赖于基于短语的统计机器翻译(phrase-based statistical machine translation,PbSMT)系统。


虽然NMT这个概念被炒的沸沸扬扬,但如何客观认识这些新技术?

这里给大家提供几个角度以供参考:


特点1.

NMT“学习”语言的方法和人类并不一样。NMT依赖于统计关联性(即PbSMT)。NMT出众的点也是在于其对于语句中关联性的处理,从而根据context来判断如何给出更为具体的翻译。


特点2.

看待翻译内容的角度不同。早期MT系统关注名词、词段。但这种方法在处理“long-distance dependency”的语言时就会出现问题。而NMT系统查看的是句子的整体,甚至整个段落或文章。这让NMT能对于上下文更加敏感。


特点3.

NMT采用基于词组(phase-based)的方法,因此更有利于翻译“形态丰富的语言”(morphologically rich languages),比如德语或匈牙利语。并且能够通过词语单词构成来预测词性。


特点4.

NMT可以跨多种语言进行外推,填补训练数据的空白(zero-shot translation)。比如在MT训练中已有英语<>德语和英语<>中文的语言对,但是没有德语<>中文的语言对,那么,在没有事先训练的情况下,NMT能自动完成新语言对翻译。虽然结果可能不如训练后的成绩,但至少可以完成从不能翻译到可以翻译的进步。


什么是NMT神经网络机器翻译?

神经网络机器翻译基本原理


神经网络是机器翻译的未来

神经机器翻译代表了与使用统计机器翻译的旧系统截然不同的方法。神经网络使用NMT系统来训练并优化翻译服务。


这些系统使用深度学习来分析大量的人工翻译。通过分析这个庞大的数据集,它可以解释整个句子,理解上下文和不同的变化,并利用语言的精妙之处。最终使得机器翻译系统更流畅自然。

  • 神经网络如何工作?

提供这种学习能力的机器的关键在于神经网络。这是一种计算技术,它被设计成模仿人脑的运作方式。在大脑中,神经通路是在我们学习的过程中形成的。如果这个途径有用且有益,它就会变得更强。如果它不能提供正确的结果,它就会变弱。


神经网络的思想是模拟大脑中神经通路的相互关联性。通过这种设计,计算机可以学习、识别模式并做出类似于人脑的决策。


人工神经网络模拟这种结构,有几十到几百万个人工神经元,称为单元。这些单位是层层排列的。一方面,您输入的单元是为了接收信息而设计的。在相反的方面,您有输出单元,表示对所学信息的响应。


在输入单元和输出单元之间,有隐藏单元。这些层构成了大多数神经网络,它们也用于形成大多数连接。


给定的一个神经网络,神经网络中每个连接的权重表明连接的两个单位之间的强度。一个正的的权重可以连接excites其他单位或连接suppresses负权重行动的其他单位。权重越大,在一个单元中有过其他连接的影响越大。


神经网络通过比较产生的输出和期望输出来学习。信息被输入到系统的输入端。然后触发隐藏单元中的连接。这将导致与输出端的连接。然后将网络实际产生的输出与期望的输出进行比较。然后根据产生的输出和期望输出之间的差异修改权重。


相比基于规则和统计系统,机器翻译中神经网络的结构使系统更自适应,能处理更多更复杂的模型。它也可以根据经验自我学习。如果它提供了不正确的输出,它能从错误中吸取教训,并作出调整,以便下次更有效地执行任务。


机器翻译在越来越多地帮助和影响我们的生活,其实机器翻译想做的事情,就是想让人们在任何时间、任何地点,用任何语言可以进行自由的沟通。