google翻訳の挙動が理解できない

2012/08/16google, 機械翻訳

以前、海外サイトの記事を検索する方法として「さっぱりわからない言語のサイトを検索する方法」を書いたけど、その方法を使って遭遇したGoogle翻訳の謎挙動。

最近話題になったニュースが韓国のサイトでは、どのように掲載されているかを確かめるために韓国語で検索したわけですよ。検索結果が上図。私は韓国語は読めないのでこのままでは意味不明。10年ぐらい前に出張で訪韓したときに読みだけは覚えたはずなんだが、それも忘れてしまった。

検索結果ページを翻訳してみた

Google翻訳のツールバーを使って、検索結果ページを丸ごと日本語翻訳します。機械翻訳に頼ると「機械翻訳は我々の夢だったわけだが」にて紹介したようなトンデモ翻訳を掴まされる可能性もあるわけですが、それでも大雑把に検討をつけて調べるためには便利に使える。怪しい翻訳部分は辞書を引くなり、別のツールと併用するなりして正確さを高めればいいわけで。

↑翻訳結果を見ると「MSN産経ニュース」ってあるんですが、何それ? ドメインみたら どう見ても「Oh My News」なんですけど。


ハイフンの有無で挙動が変わる

わけわかんないので、Google 翻訳単体で試してみました。どうやら直前にハイフンがあると「MSN産経ニュース」と翻訳されちゃうようです。

うーむ。どんな翻訳ロジックだとこんな翻訳になるのでしょうか、さっぱり理解できません(google翻訳は「統計的機械翻訳」を使ってるんですけど、どんな元データを集めたらこうなるんだろ?)。

ちなみにYahoo!翻訳だと、前者も oh my news になりました。さらに悪い。

関連リンク

google, 機械翻訳

Posted by ず@沖縄