インタプリタかなくぎ流

いつか役に立つことがあるかもしれません。

iPhoneやAndroidは機械通訳の夢を見せるか

「言語の壁は崩壊寸前」という、興味深い記事を読みました。

こういう話題に接すると、商売柄すぐに「食えなくなるかも」といったナマな思考回路が働くのですが、そこをいったん離れてもっと大きな空想をしてみたいと思いました。

jp.wsj.com

三年ほど前に「自動通訳機械の実現は、量子コンピュータでも実現しないと難しいんじゃないか」とやや皮肉まじりに書いたことがあるのですが、この記事を読んで以前は「まだまだ」と思っていた自動通訳機械(自動翻訳+音声による出入力)*1が、意外にはやく実現するのかも知れないと思いました。特に観光ガイドや、見学・買い物等のアテンドなど「難易度」の低い分野ではすでに様々なサービスが登場していますし、その精度も日々向上しているようです。

一方で音声処理技術の進化も日進月歩、私のような門外漢でさえ、その利便性に「こんなこともできるのか!」と驚きの連続です。登場した当初はそのとんちんかんな答えや無反応が笑いを誘ったSiriやGoogle音声認識だって、かなり便利になってきました。今では私も往来で検索するときなど、かなりスマートフォンの音声機能を使っています。

Twitterなどでは、上記の記事に対して「通訳者や翻訳者は失業する」という意見も散見されました。でも私は、複雑な交渉や文化芸術等に関する領域、テクニカルな内容満載の会議通訳では、今後もまだ当分の間は生身の人間が必要とされると思います。型どおりの儀式や会議ならともかく、最先端の知見がぶつかり合う現場でのやりとりは、用いられる言葉の範囲があまりにも広く、予測不可能で展開が複雑に絡み合っているからです。

ですが……それも、この記事が言うように「データ量の増加とコンピューターの能力向上、ソフトウエアの改善」という時間の問題かも知れません。今はまだ不完全な機械翻訳でも、例えばDuolingo*2のように膨大な数の人間が翻訳結果の改善に力を注ぎ、音声による出入力も各国で官民挙げて技術向上が図られていくのであれば。

自動通訳機械が普及した状態とは

実務に耐えうる自動通訳機械なりシステムなりが実現するのが数年先か数十年先か、それとも百年単位の遠い未来かは分かりませんが、もし本当に実現したら人々のコミュニケーション方式は大きく変わるでしょうね。

現段階の自動通訳機械は、パソコンやiPhoneAndroidなどのスマートフォン等のデバイスを介した、訳出にも多少のタイムラグが生じるプリミティブなものですけど、今後ウェアラブル端末がより進化して、コミュニケーションにおけるストレスを感じない装着感とタイムラグで自動通訳が行われるようになるかも知れません。腕時計と同じようなごく普通の身体感覚として馴染んでいくのでしょう。

現在の我々は、自分の発話を理解してくれていると思える相手に向けてでないと、話すときにストレスを覚えるようです。電話でも相手が自分の言語を理解してくれないときはどうしようもない「隔靴掻痒感」に襲われますし、逐次通訳をしているときなど相手側はこちら側の主役ではなく通訳者の我々に向かってコンタクトしてくる傾向があります。

でもこれも、生まれたときから「自動通訳環境」がある人々ならごく自然に「装置」を介したコミュニケーションに慣れ、それに応じた身体作法を身につけていくのかも知れません。生まれたときからインターネットがあって、ラインなどでの会話が「デフォルト」である若者たちのように。異なる言語間の背後にある「自動通訳システム」が、その存在をほとんど感じさせない空気のようなものになって、人類にとって言語の差とか他言語などという概念が徐々に薄まっていくのかも知れません。

そして母語や外語という概念も軽くなり、ひいては通訳者や翻訳者という職業も「かつてはそういうお仕事があったんだってね」と語られるような時代が来るのかも知れません。電話交換手や植字工やキーパンチャーや……などのように。

知は差異に宿る

ですが、ここで大きな疑問があります。異なる言語間のコミュニケーションがすべて自動通訳に置き換わったとして、人類の知見はそれ以上進歩するのでしょうか。自動通訳システムは異なる言語間の膨大な翻訳結果を集積したビッグデータをその基盤としていますが、人々が十全に自動通訳システムを享受するようになったあかつきには翻訳作業、つまり母語と外語との往還なり比較なり分析なりをする人が減っていくという自家撞着に陥ることはないのでしょうか。

人それぞれが、それぞれの母語だけで暮らしていくことができ、母語以外の例えば英語のような「世界共通語」の習得に人生のかなりの時間を割かなくてもよくなる未来は今よりずっと素晴らしい世界のようにも思えます。でも一方で、語学をやった者の実感として、母語と外語の往還にこそ我々の思考を深めるカギが潜んでいるとも思えるのです。人類は絶えず異言語・異文化に目を向け、興味を持ち、それを知りたいと思う欲求こそが学びを起動させ、そこから得られた洞察が人類の「知的コンテンツ」となって蓄積されてきました。異なる者との接触の中で、多様性の中で思考も鍛えられてきたのだと思います。

そうした学びが自動通訳システムで失われた、あるいは大幅に減少した未来社会で、各言語の使い手が単に自分の母語の内側だけでコミュニケーションを行い(だって他言語とのコミュニケーションはストレスのない状態で提供されているのですから、母語のみで聞き話すこととほとんど同じです)、異言語や異文化に対する興味も警戒も共感も反感も怖れも憧れも単に母語の内輪での振幅に押し込められてしまった世界で、知は深められていくのでしょうか。

前出の記事は「理論的には、機械翻訳のおかげでわれわれ誰もがバベルの塔を意のままにできるようになるだろう」という言葉で締めくくられています。私は「神がバベルの塔を破壊し、人々の言語をバラバラにした」という神話の意味は本当に深いと思いました。バラバラになった差異の中にこそ、知は宿ると思うからです。

*1:ネットを渉猟するに「自動通訳」や「自動翻訳」や「通訳機」等、いろいろな言葉が混在しているようです。現段階ではネット翻訳のような文章の変換が「機械翻訳」と呼ばれているようですが、その音声版、つまり「機械通訳」についてはその呼称が定まっていない印象。例えばNTTドコモが取り組んでいるという「みらい翻訳」という事業ですが、その音声版サービスは「はなして翻訳」と名付けられており、文章の変換=翻訳、音声の変換=通訳という概念が「ごっちゃ」になっています。もっとも中国語ではTranslationもInterpretationも“翻訳”と言い、文章の変換(日本語で言う翻訳)は“筆譯”、音声の変換(日本語で言う通訳)は“口譯”なんですけど。ああややこしい。

*2:私もここで英語の学習に取り組んでいますが、学習中に入力する母語方向への翻訳が、翻訳結果の改善に貢献するような仕組みになっています。→Wikipedia