インタプリタかなくぎ流

いつか役に立つことがあるかもしれません。

自然言語処理にいたるまでの壮大な物語

四月に入り、職場への通勤が復活しました。……が、新学期の開始はゴールデンウイーク後まで延期されたため、教員の自宅勤務は継続ということに。でも私は「小人閑居して不善を為す」を地で行くような人間なので、自宅にいると仕事が全くはかどりません。というわけで、時差出勤でラッシュを避けつつ、毎日暦通りに研究室へ出勤しています。

出勤して良いこともありました。昨日は学校の購買から「マスクが入荷しました」とのお知らせが。ひとり3枚入りを3パックまでということで、とりあえず9枚入手できました。予防のためというより、学校から「授業時はマスクをしてください」と言われているためです。5月からの開講に備えてとっておこうと思います。

自宅勤務中はとにかく「積ん読」中の本を減らすべく努めました。その中で読んだのが川添愛氏の『白と黒のとびら』です。言語学自然言語処理がご専門の川添氏。以前に『働きたくないイタチと言葉がわかるロボット』を読んでとても面白かったので、その一連の著作のスタートになった本書も読んでみようと思ったーーでも長らく「積ん読」になっていたーーのです。

偉大な魔法使い・アルドゥインに弟子入りした少年・ガレットが、魔法使いの勉強をしながら言語に関するさまざまな謎を解いていくという冒険物語。そう、この本は言語学情報科学、数学などの基礎理論である「オートマトン理論」と「形式言語理論」を、ファンタジー小説の形で解説しようという、大変野心的な試みなのです。

f:id:QianChong:20200403090100j:plain:w200
白と黒のとびら: オートマトンと形式言語をめぐる冒険

オートマトンとは、この本によればコンピュータなどあらゆる機械がどのような計算や動作の処理を行っているのかを表現したもの、だそうです。そこで処理される、白と黒の二つの文字からなる文字列の集合、これが「形式言語」で、この物語ではオートマトンが「遺跡」として立ち現れ、その遺跡の中で次々に現れる「部屋」がオートマトンの状態、入力される記号が「白と黒のとびら」で表現されています。白と黒はもちろん、デジタルの0と1に相当するわけです。

この本では様々な「遺跡」の設計図が示され、処理される形式言語が「●●○●○●●○●○●○●●○●○」のように記述されます。それらを確認しながら読み進めるのはかなり骨が折れるのですが、この本が素晴らしいのはそうやって理論の基礎を解説しながらも、読み応えのあるファンタジー小説としてもきちんと成立しているところ。いやむしろ、物語の展開が面白くて、理論の理解が後回しになってしまうくらいです(こらこら)。

f:id:QianChong:20200403094020p:plain

この『白と黒のとびら』では主にオートマトン形式言語の基礎が解説され、チューリングマシンについても少し踏み込んでいます。そして続編となる『精霊の箱』では、チューリングマシンが主題に据えられ、計算とは何か、コンピュータは何しているのかについて、さらに壮大なファンタジー物語が展開していくのです。私はこの続編(上下巻に別れた大部の物語です)で、ついにその難しさについていけなくなり、単にファンタジーを楽しむだけで終わってしまいました……。

f:id:QianChong:20200403094316j:plain:w200
精霊の箱 上: チューリングマシンをめぐる冒険

f:id:QianChong:20200403094335j:plain:w200
精霊の箱 下: チューリングマシンをめぐる冒険

それでも、二進法や暗号については非常に面白く読みました。またコンピュータが形式言語ではなく自然言語を処理する際の課題や困難についてもおぼろげながらその姿が見えてきたように思いました。さらに学びたい人向けの参考図書の紹介も充実しています。なるほど、ここからさらに発展して、以前読んだ『働きたくないイタチと言葉がわかるロボット』につながっていくわけですね。同書は「人工知能から考える『人と言葉』」が副題になっています。

もう一冊、同じ川添氏の『自動人形の城』も買ってあるので、これから読もうと思っています。こちらは帯の惹句に「『人工知能』と『人間の言葉』をめぐる新たなストーリー」とあります。『働きたくないイタチと言葉がわかるロボット』もそうでしたが、これも通訳や翻訳に興味のある方にとっては知的好奇心を痛く刺激される一冊になるような予感がいたします。

f:id:QianChong:20200403094508j:plain:w200
自動人形の城(オートマトンの城): 人工知能の意図理解をめぐる物語

f:id:QianChong:20200403094621j:plain:w200
働きたくないイタチと言葉がわかるロボット 人工知能から考える「人と言葉」