分野特定のニューラル機械翻訳エンジンを作ってみた〜データ収集とパフォーマンス検証を中心に（その２）

分野特定NMTエンジンのパフォーマンス検証

分野特定のニューラル機械翻訳エンジンを作ってみた〜データ収集とパフォーマンス検証を中心に（その１）で集めたIT分野の中日対訳データを利用して、分野特定した日中・中日NMTエンジンを実際に試作してみました。
翻訳エンジンのモデルを作るには、OpenNMTというツールを利用しました。

では実際に、テスト文（IT分野）を翻訳し、IT分野NMTのパフォーマンスを見てみましょう。
ここに、比較対象となる汎用NMTは業界最先端のGoogle翻訳に設定しました。
テーブルの中の数字は自動評価基準であるBLEU値（4-gram）です。（BLEUの説明）

	中日	日中
IT分野NMT	40.79	35.35
Google	37.53	28.43

結果のBLEU値から、IT分野のテストの場合、IT分野NMTは、少量と思われるデータ量でも、汎用のGoogle翻訳より良い評価を得られることがわかりました。

実際にIT分野NMTは汎用のGoogle翻訳よりどのような優れた訳を出したでしょうか。
以下に例を挙げます。

原文	参考訳	IT分野NMT訳	Google訳
过渡权重	移行重み	移行重み	移行重量

中国語「权重= weight」に対して、IT分野NMTの日本語訳は正しく「重み」になりましたが、Googleは誤って「权重 = weight」の汎用意味の「重量」を出力してしまいました。

このように、汎用NMTが抱えている専門用語訳の問題は、IT分野NMTを用いると改善できます。

十分でない対訳データ量でも、汎用NMTに勝る可能性のある分野特定NMT

今回は、分野特定のNMTエンジンを作るために、対訳データの収集方法を検討しました。本文で紹介した他のデータ収集手法は、別の機会があれば、紹介したいと思います。
また、パフォーマンス検証では、用いた対訳データ量が十分と言えなくても、分野特定NMTが最先端の汎用NMTに勝る可能性を示しました。
分野特定のNMTを確保した上で、ようやく顧客の期待に応える翻訳サービスを提案できるのです。その翻訳の流れは以下のような仕組みになります。
１. 入力文の分野を自動判定する機能
２. 各分野特定のNMTエンジンに渡す
３. 適切な分野エンジンからの訳文を出力
いかがでしたでしょうか。
分野特定したNMTのイメージを少し掴めましたでしょうか。
これからNMT関係の内容をさらに紹介していく予定ですので、お楽しみに！

分野特定のニューラル機械翻訳エンジンを作ってみた〜データ収集とパフォーマンス検証を中心に（その２）

分野特定NMTエンジンのパフォーマンス検証

十分でない対訳データ量でも、汎用NMTに勝る可能性のある分野特定NMT

カテゴリ

アーカイブ

分野特定のニューラル機械翻訳エンジンを作ってみた 〜 データ収集とパフォーマンス検証を中心に（その２）

分野特定NMTエンジンのパフォーマンス検証

十分でない対訳データ量でも、汎用NMTに勝る可能性のある分野特定NMT

カテゴリ

アーカイブ

分野特定のニューラル機械翻訳エンジンを作ってみた〜データ収集とパフォーマンス検証を中心に（その２）