bilingual correspondence recursive autoencoders for statistical machine translation @小町研...

Bilingual Correspondence Recursive Autoencoders for Sta7s7cal

Machine Transla7on Jinsong Su, Deyi Xiong, Biao Zhang, Yang Liu,

Junfeng Yao and Min Zhang

Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing

紹介者叶内晨 (@shin_kan0) @小町研 EMNLP読み会2015

この論文について

•  SMTのために句対の分散表現を同時に学習

•  子ノードの構造を揃えて，対応した子ノード同士のエラーを小化 – アライメントに忠実な句対の分散表現を学習 – 2言語の異なるレベルの意味対応を獲得 – 中英 SMT の State-‐of-‐the-‐art を達成

F E ^ ^ ? ? 原言語目的言語 ? ?

関連研究：分散表現の句への適応

•  Recursive AutoEncoder で句を表現[Socher+ 10]

•  2言語の句をRAEで表現 – SMTの並べ替えモデルに応用[Li+ 13] •  A Neural ITG Reordering Model

– SMTの翻訳モデルに応用[Zhang+ 14] •  Bilingually-‐constrained Recursive Auto-‐encoder

Bilingually-constrainedRecursive Auto-encoder

f e e’: 対応していない句

今まで

[Zhang+ 14]

問題点: 句と句の内部構造を考慮していない

今まで

アライメント

•  句対全体としては分散表現で対応している •  nf1, nf2, ne は，それぞれ対応していない •  中身を対応させたら，より良い句対になるのでは？

Bilingual Correspondence Recursive Auto-‐encoder (BCorrRAE)

提案手法

アライメント

•  各ノードの句と対応する句を探す •  複数対応するときは小のものを選択

•  全ての句対を記憶(SAC node) •  句対ごとに学習

逆方向もやる

0-‐2 2-‐1 3-‐0

エラーの計算方法

①句を作ったときの RAE の Reconstruc7on Error ②2言語で対応していないノード (non-‐SAC) への罰則 (Consistency Error) ③2言語で対応しているノード (SAC) の類似具合

(Cross-‐Lingual Reconstruc7on Error ) ④正則化項

α= 0.12, β = 0.63, γ = 0.25

②Consistency Error

Inc→

cns→

•  句がcnsであるほどエラーが少ない

③Cross-‐Lingual Reconstruc7on Error

a. ベクトルを目的言語側に飛ばす b. その子ノードを生成 c. 目的言語側のベクトルとの差が誤差

実験設定

•  翻訳機：log-‐linear framework [Och and Ney 02] 1.  rule transla7on probabili7es in two direc7ons 2.  lexical weights in two direc7ons 3.  targets-‐side word number 4.  phrase number 5.  language model score (SRILM 5gram) 6.  Score of maximal entropy based reordering model (MEBTG) 7.  proposed feature

•  DataSets –  Train: FBIS corpus and Hansards part of LDC2004T07 corpus

•  1M parallel sentences (25M Chinese words, 29M English words) –  Dev: MT05 –  Test: MT06, MT0

実験結果(BLEU)

句の翻訳結果の例

•  意味は類似した句が対応

•  SRC側とTGT側の文法は必ずしも一致せず

•  句の意味が類似しつつ，アライメントに矛盾しないような句が対応

まとめ

•  SMTのための木構造の同時句分散表現を学習

•  子ノードの構造を揃えて，対応した子ノード同士のエラーを小化 – アライメントに忠実な句対の分散表現を学習 – 2言語の異なるレベルの意味対応を獲得 – 中英 SMT の State-‐of-‐the-‐art を達成

bilingual correspondence recursive autoencoders for statistical machine translation @小町研...

Science

recursive methods in discounted stochastic games

recursive algorithms & program correctness 1.algorithm....

language as a latent variable: discrete generative models...

recursive algorithms & program correctness

k penerapan algoritma recursive best first search …

variational autoencoders with jointly optimized...

數值方法 2008, applied mathematics ndhu 1 nonlinear...

training autoencoders for state estimation in smart...

disclaimer - seoul national...

recursive parsing

compiling high performance recursive filters - inria ·...

recursive snarks - cs251.stanford.edu

adversarial autoencoders

durbin-levinson recursive method - unitn.it ·...

recursive macroeconomic theory_solution manual

Özyinelemeli(recursive) algoritma tasarımı

parallel recursive filtering of infinite input...

recursive c++

primitive recursion - department of...

hangyo emnlp paperreading2016