インタプリタかなくぎ流

いつか役に立つことがあるかもしれません。

ヒトの言葉 機械の言葉

川添愛氏の『ヒトの言葉 機械の言葉』を読みました。機械が人間の言葉を理解することについての基礎的な知識を紹介する内容で、母語の習得や外語学習についても多くの示唆が得られる一冊です。

f:id:QianChong:20201116102937j:plain:w200
ヒトの言葉 機械の言葉 「人工知能と話す」以前の言語学 (角川新書)

AI(人工知能)技術の発達で、現在ではコンピュータやスマホなどの「機械」が人間の言葉を扱う場面が日常的に増えてきました。それもテキストや文章のみならず、音声言語の処理についてもこの分野の技術は日進月歩の感があります。その勢い余ってなのか、最近は「まもなく機械通訳が普及して、通訳者の仕事はなくなる」とか「ドラえもんの『ほんやくコンニャク』みたいなシステムが実用化されて、人類は外語学習から解放される(だから英語なんか必死に学んでもムダ)」といったような言説も時折目にするようになってきました。

私などそういう言説に接するたび、職業的な「ナマ」な立場からも大いなる関心と不安を持たざるを得ないのですが、AIや言語処理についての入門書を読み漁っていると、ことはそう簡単ではないということがおぼろげながらに分かってきます。定型的なフレーズだけを使っても対応がほぼ可能な買い物や観光などの用途ならともかく、もっと高いレベルの(専門的で、抽象的で、複雑で、時に曖昧な)コミュニケーションに耐えうる機械通訳的なサービスを実現するのはとてつもなく難しいということが分かるのです。

この本でもその「難しさ」についての例がいくつも紹介されています。例えばそのひとつはこんな感じです。

太郎と花子は『春の小川』と『さくら さくら』を歌った。

川添氏はこの表現には少なくとも三通りの解釈があるといいます。①太郎と花子が両方の曲を一緒に歌った。②太郎が両方の曲を歌い、花子も別に両方の曲を歌った。③太郎が『春の小川』を歌い、花子は『さくら さくら』を歌った。これらを訳すとすればそれぞれ違った表現になりますが、元の発言がそのどれであるかを判断するためにはこの文章だけでは足りず、さらに情報が必要です。それはとりもなおさず、機械がこの文章を理解する際の困難度を示しています。こうした曖昧さというか不明確さ、あるいは「言外の意味」みたいなものを機械が理解するのは容易ではないんですね。

私が台湾で社内通訳者として働いているときに、施工現場でとある日本人技術者がこんな発言をしたことがありました。

向こうにあるあれ、ああしとくのは何だから、何とかしちゃってよ。

これを中国語へ訳す立場にいた私は、その時にその技術者が顔や指で指し示していた方向と、それまでの現場での背景知識と、その瞬間における現場の状況などを加味して、なおかつ若干の再確認をその技術者に入れつつ訳したわけですが、そういう「言外の意味」を機械が理解するのは(いまのところは)ほとんど不可能だということがこうした入門書を読むだけでも分かってきます。

生身の人間の発言は、時に意図的か無意識かに関わらず曖昧な部分が多いですし、冗語や間投詞も入ります。個々人の発音や語彙の選択の癖や偏りもある。それらを一つ一つクリアしていった先に実用に耐えうる機械翻訳が実現するとして、そこまでには超えなければならないハードルがものすごく多いんですね。そう考えると、翻って我々人間の行っているコミュニケーション、特に音声によるそれが、どれだけ高度で複雑なことであるのかということも分かってきます。

この本ではその高度で複雑なコミュニケーションのベースになる母語の獲得についても、興味深い論点が紹介されています。母語の「生得説」と「学習説」など、言語学がご専門の方であれば言わずもがなの大前提のようですが、私を含む一般の人々にはとても新鮮に映るのではないでしょうか。外語の習得にコンプレックスと憧れがない交ぜになった心性を持ちやすい私たち日本語母語話者にとっては特に。

この、母語話者が自分の母語をどうやって身につけたのか、それもほとんど例外なく誰もが成功できるのはなぜかという謎は非常にスリリングで知的好奇心をそそられます。よく、子供は胎児の頃から母語のシャワーを浴びて蓄積を続けており、それが「臨界」に達したところで母語を話すようになるというイメージが語られますが、この本を読むとそれはかなり単純な考え方であることがわかります。

子供たちは、周りにいる大人たちがその言語のすべての知識を与えなくても、また間違った使い方を直されなくても、さらには自分から何度もトライアンドエラーを繰り返さなくても、まるで「一を聞いて十を知る」ように母語を獲得していくのです。それに対して外語の習得では文法や語彙など最大限の知識を学習し、間違った使い方を直され、自分から何度もトライアンドエラーを繰り返さなければ高いレベルでの獲得は難しい。

こうした事実をきちんと学んで知っておくことは、「子供が言葉を覚えるように外語をマスターできる」とか「音声を聞き続けるだけでペラペラになれる」などの怪しげな語学商売に引っかからないためにも大切なことだと思います。そして外語の習得がなぜこんなに難しいのかというこうした論点は、ぜひ初中等教育の段階で学んでおくべきではないかとも。

小学校から英語やプログラミングなどの必修化が行われるなら、それと並行してこうした言語学的な知見を反映した「言語リテラシー」的な科目も組み合わせるべきです。そうした背景知識の学習と並行して英語などの外語やプログラミングなどを学ぶほうが、その知識そのものがより分厚いものになるでしょうし、またその後の人生をより豊かにしてくれるだろうとも思うからです。