Microsoft Translator(翻訳サービス)でディープラーニング(深層学習)のAI翻訳を比較してみた

今ではあたり前のように利用されている「翻訳サービス」や「翻訳アプリ」ですが、年々翻訳結果も向上していて、結果の文章に違和感がなくなってきました。
ですが、長文などになってくるとやはり前後の文章の解釈が必要になってきますので、機械的な翻訳方式ではさすがに違和感が否めないところがあります。
そこで最近取り入れられてきたのが、ディープラーニング(深層学習)のAI技術を使った翻訳方式です。
今までの翻訳方式は応用統計学による機械的な翻訳方式で今までの学習結果をただ結果反映しているにすぎませんでした。
それをディープラーニング(深層学習)を活用することで、前後の文章も自動で認知したAI翻訳ができるようになります。

「Microsoft Translator」はマイクロソフトが提供している翻訳サービスですが、こちらにもディープラーニング(深層学習)を利用したAI翻訳の実装が徐々に始まっており、こちらのサイトで両方の翻訳方式をテストして比較することが出来るようになっています。

Try and Compare(試して比較)
https://translator.microsoft.com/neural

ここでは翻訳を実行すると翻訳結果が2通りで表示され、どの翻訳方式で処理されたのか分からなくなっています。(※既定でサンプルの文章が表示されます。)

結果のニュアンスは日本語の方が判定しやすいので、「Japanese → English」から「English → Japanese」に切り替えて、以下の英文で試してみました。

例文A
「She was the sole passenger on the bus after the other travelers got off」

さて、どっちがどっちでしょうか?

「Is this better?」(どっちがいい結果ですか?)のボタンを押すことで2つの翻訳方式がどちらの結果だったのかを見ることが可能です。

結果は

Statistical(機械翻訳)
「他の旅行者が降りた後バスの中で唯一の乗用車だった」

Neural(AI翻訳)
「彼女は他の旅行者が降りた後、バス上の唯一の乗客だった」

さすがに機械翻訳の「唯一の乗用車」という翻訳はありえないので、AI翻訳の方がいい結果です。

 

次に、少し長文の以下の翻訳も試してみます。

例文B
「It would not provide any estimate on when products would be available for sale on its website again, but it did say it planned to make more products.」

Statistical(機械翻訳)
「とき製品が再び、そのウェブサイト上の販売のため利用できる任意の見積もりは提供しませんが、それはそれはより多くの製品を作ることを計画したと言います。」

Neural(AI翻訳)
「それは、製品が再びそのウェブサイトで販売するために利用できるだろうときにどんな見積もりを提供しません、しかし、それは、より多くの製品を作ることを計画したと言いました。」

こちらは長文になりますので、なかなか判断が難しいです。AI翻訳は文体はよくなっていますが、接続詞の区切り方でいまいち意味が通じづらいです。(どちらとも赤字添削したいぐらいです。)

他の翻訳サービス

ちなみに次の2つの翻訳サービスでも同じ英文で試してみました。
Google翻訳

A.「他の旅行者が降りた後、彼女はバスで唯一の乗客だった」
B.「製品がウェブサイト上で再び販売可能になる時期については、何も見積もっていないが、製品を増やす予定だとしている。」

excite翻訳

A.「他の旅行者が降りた後に、彼女はバスの唯一の乗客であった」
B.「再び製品がそのウェブサイトのセールで利用可能な時は、どのような見積りも提供しないけれども、それは、それが、より多くの製品を作ることを計画すると伝えていた。」

Google翻訳は既にAI翻訳に切り替えたということですので、順当でしょう。
昔から文章認識に定評のあるexcite翻訳は、どちらの方式かわかりませんがなかなかいい感じです。

まとめ

どうだったでしょうか。比較することで、ディープラーニング(深層学習)の活用に対してかなり参考になったと思います。
もちろん皆さんも試したら、しっかりどちらの翻訳結果が優秀なのか「Is this better?」ボタンを押して、どっちがいい結果の翻訳だったか評価して確認してみてください。
たまにAI翻訳も変な結果を返すことがありますが、これからどんどんデータを蓄積することで成長していくはずですので、もっと頑張ってくれるでしょう。
(個人的にはページ翻訳が暗号化サイト(httpsサイト)に対応していないのを先に直してほしいのですが。)

2017年2月現在で、Microsoft Translatorの翻訳は統計学習の機械翻訳による結果表示ですが、以下のパラメーター付きのアドレスにすることで、常にAI翻訳に切り替えることが可能になっています。
すぐにでも切り替えたい方は、こちらを利用してみてください。

Microsoft Translator(AI翻訳)
http://www.bing.com/translator?category=generalnn

ちなみにこんな翻訳も比較してみました。どちらがいいかの判断は皆さんにお任せします。

この記事をシェアする
Tweet about this on TwitterShare on Facebook0

Comments

Comments