ダグラス・ホフスタッター ( mirai.click でのインタビューはこちら) は数十年にわたり、生物学的および技術的な知能の研究を行ってきました。彼は適応システムによる進歩に感銘を受けていますが、少なくとも一部の分野では依然として人間のほうが明らかに有利であると考えています。
翻訳の進歩
これは、ホフスタッター氏がアトランティック誌のエッセイで説明しているように、たとえばテキストを別の言語に翻訳する場合にも当てはまります。 Google 翻訳はここ数年で間違いなく大きな進歩を遂げました。簡単な文章ですら理解できない喃語に歪められてしまう時代は終わりました。これは、Google が単語間の関係を統計的に分析できるニューラル ネットワークを使用しているためでもあります。

「ディープラーニング」
これらの深層学習アルゴリズムにより、テキスト翻訳の結果が向上しました。ディープラーニングによって強化された Google システムは、現在 96 の言語を提供しています。ホフスタッター氏は、Google 翻訳のせいで翻訳者が絶滅の危機に瀕しているというメディア報道を読み、翻訳機の能力を自分の目で確かめることにしました。この男性は複数の言語を話し、英語、フランス語、ドイツ語、中国語の Google 翻訳をテストしました。これらはすべて彼のレパートリーです。
Google翻訳はがっかりする
彼の結果は、彼が以前抱いていた疑念を裏付けるものだった。Google アルゴリズムのテキスト分析はより複雑になっているが、システムがそれを真に理解するにはまだ長い道のりである。英語の文章「彼らの家では、すべてがペアになっています。彼の車と彼女の車、彼のタオルと彼女のタオル、そして彼の図書館と彼女の図書館があります。Google 翻訳はフランス語を「Dans leur maison, tout vient enpairs」に変換します。私は、ヴォワチュールとヴォワチュール、セルビエットとセルビエット、図書館とシエンヌを学びます。」
Google の翻訳ソフトウェアは、フランス語では所有代名詞が所有者ではなく目的語と一致していることを考慮していないため、罠にはまりました。翻訳すると文の意味が完全に失われます。さらに、アルゴリズムは最後の「hers」を単数ではなく複数として解釈しました。

その後、ホフスタッターはその文章をフランス語に正しく翻訳しました。「Chez eux, ils ont tout en double.」あなたの目の中に車があり、あなたの目の中に車があり、あなたの目にはナプキンがあり、あなたの目にはナプキンがあり、あなたの目の中にあなたの図書館があり、あなたの目の中にあなたの図書館がある場合、Google 翻訳はこの結果も翻訳できません。」英語にすると「家では何でも二重になっています。彼自身の車と彼自身の車、彼自身のタオルと彼自身のタオル、彼自身の図書室と彼自身の図書室があります。」
システムには「経験」が不足している
ホフスタッター氏は、これらの間違いは、人々がカップル、家、所有物、嫉妬などについて多くの情報を持っていることが原因であると考えています。一方、Google 翻訳にはまったく経験がありません。文字で構成される単語の連鎖を扱いますが、これらの単語が物や概念を表しているとは知りません。ホフスタッター氏は、そのようなことを考慮したシステムを構築することは原理的には可能であると考えています。ただし、このプログラムは Google 翻訳とはまったく異なる構造になります。
ホフスタッター氏は機械翻訳をさらにテストしました。たとえば、次のドイツ語のテキストの断片は次のとおりです。「敗戦後、現在学部の多数派を占める多くのドイツ民族主義者の教授たちは、大学を「奇妙なもの」から守ることが、いわば自分たちの義務であると考えた。最も弱い立場にあったのは、リハビリテーションを受ける前の若い科学者でした。とにかく女性科学者は論外だった。本からの「彼らは自分たちをウィーンサークルと呼んだ」についてはほとんど合意がありませんでした。
ホフスタッター自身はこの文章を次のように訳している。「敗戦後、その時までに教員の大多数を占めていた汎ゲルマン主義的傾向を持つ多くの教授たちは、高等教育機関を「望ましくないもの」から守ることがほぼ自分たちの義務であると考えた。解雇される可能性が最も高いのは、大学で授業を教える権利をまだ獲得していない若い学者たちだった。女性学者については、まあ、制度の中にまったく居場所がありませんでした。 「これほど明確なことはありませんでした。」
一方、グーグル翻訳は次の文章を示唆している。「敗戦後、多くのドイツ国民の教授たちは、一方学部の大多数は、大学を「異質なもの」から守るのが自分たちの義務であると考えた。若い科学者はリハビリテーションを受ける前に最も脆弱でした。そして科学者たちはとにかく疑問を抱かなかった。それらはほとんどありませんでした。」
Google にとって統計だけでは十分ではない
Google 翻訳がここで限界に達していることは明らかです。ホフスタッター氏は、Googleによる「奇数」という言葉の使用を特に強調している。 Google 翻訳は統計分析に基づいて、「奇数」はほとんどの場合「2 で割り切れない」という意味で使用されるという結論に達しました。だからこそ英語の「odd」を選んだのです。一方、ホフスタッターは本文の内容を理解し、洗練された解決策を見つけました。 Google 翻訳の最後の文は、原文の意味をまったく反映していません。
———-
これも興味深いかもしれません:
- 謎のヴォイニッチ手稿:人工知能が彼の言語を決定したと主張
- 人工知能が死を予測する
- 音声認識、自動運転とその仲間 – ナイジェル・トゥーン氏へのインタビュー

———-
ホフスタッター氏の中国語テキストを使った実験では、Google 翻訳のパフォーマンスはさらに悪かった。しかし、ヨーロッパ言語間の翻訳に関して言えば、翻訳プログラムはホフスタッター氏の期待を満たしていません。 「読者の中には、私が厳選したテキストの一節を使って Google 翻訳を攻撃しているという考えを持つ人もいるかもしれません。そうではないのです。私が現在読んでいる本のほぼすべての段落で、無意味で理解できない文章を含む、あらゆる形や色の翻訳ミスが発生しています」とホフスタッターは書いています。
翻訳機が英語の詩で芸術的な小説を書き、ユーモア、哀愁、表現を忘れることなく正確にメーターを遵守する日が来て初めて、彼は敗北を認めるだろう。
