入力拡張と制約付きデコーディングによる語彙制約付き機械翻訳

Abstract

語彙制約付き機械翻訳は,翻訳文に含まれてほしいフレーズが指定された際に,それらのフレーズを含む文を生成するという制約の下で機械翻訳を行うタスクである.本論文では翻訳モデルの入力系列の拡張によってビームサーチによる語彙制約付きデコーディングの探索を効率化する手法を提案する.日英および英日翻訳での実験により,提案手法が従来手法と比べて少ない計算コストで高い翻訳精度を実現できることを確認した.また,自動抽出されたノイズの多く含む語彙制約に対しても語彙制約付き機械翻訳手法を適用する手法を提案し,日英翻訳での実験によって一般的な機械翻訳手法と比べて高い精度が達成可能であることを示した.

Publication
自然言語処理