インタプリタかなくぎ流

いつか役に立つことがあるかもしれません。

自動でディクテーションできちゃった

む〜、いつかはそうなるだろうと思っていましたが、ついにこうなりましたか……。いや、昨晩こんな記事を拝見したのです。

note.mu

先般Google Documentの「OCRっぷり」がすごい、という話題に接していたので、これはもう早晩、音声から直接文字に、つまり“聽寫(ディクテーション)”が自動化されるだろうなと思っていたのです。

そうしたら、上掲のこの記事です。拝見するに、もう一昨年あたりから一部では周知の状況だったよし。今さらながらわがアンテナの感度の低さに切歯扼腕することしきり。

note103.hateblo.jp
walkingmask.hatenablog.com

……で、自分のMacBookにはすでにSoundFlowerが入っているので、さっそく適当な中国語の音声で「自動文字起こし」を試してみました。まずは今教材を作っている最中のこれ。台湾の「外貿協会」が最近行った「2018年度記者会見」の映像です。アナウンサーではない発話者で、実況録音の上、ロボットのPepper君が話す機械的な中国語も入っています。

youtu.be

結果は、これ。

f:id:QianChong:20180307084206p:plain

予想以上の精度にちょっと驚愕しました。特に“百分之十二點六”としゃべっているところを自動で“12.6%”に変換したりしているところなど、単に音声を次々文字にしているだけではない奥深さを感じます。こうした実況録音ではなくもっとクリアな音声であれば精度はさらに上がるはずです。

というわけで、今度は教科書の音声で試してみました。

f:id:QianChong:20180307084417p:plain

一部に惜しい点はありますけど、ほぼ完璧に自動文字起こしできちゃいました。しかもGoogle Documentが変換しているところをじっと観察していると、例えばいったん“实时(リアルタイムで)”と聴き取って変換された後、その単語を含む一文がすべて現れた時点で前後の文意を判断して“时时(常に、ひっきりなしに)”に直したりしていました。

しかもこれ、音声や動画のファイルを流しっぱなしにしておいても、安定してGoogle Documentに記録し、定期的に保存していってくれます。ということは、もう文字通り寝ている間に大量の「テープ起こし」(死語ですね、もはや)が完了してしまうのです……あああ、これは麻薬的です。

私は十数年前から、勉強になるからと(実際なるんですけど)趣味と実益(通訳教材に使うのです)を兼ねてディクテーションを続けてきました。広範な地域の様々な中国語を聞いて文字化してきたことで、特にリスニング能力が鍛えられたと感じています。

qianchong.hatenablog.com

なのに、ここまで簡便に音声が文字化できちゃったら、自分の学習意欲が下がってしまわないか心配です。だって教材作りなんかは、こうやって自動で様々な音声をとりあえずテキストにできてしまえばと〜っても生産性があがりそうですから。でも、生産性は上がるけど自分の勉強になりにくい、つまり仕事が「役得」や「喜び」にならず単純な労働に成り下がっちゃうというのはやっぱりいやだなあ。

そしてこの件に関してTwitterでつぶやいたところ、このようなご意見が。

いや、ほんと、おっしゃる通りです。デジタルネイティブの生徒さんたちは、私なんかよりよほどこうした「技術」に聡いですから。すでに留学生のみなさんは授業中にスマホ辞書やネット翻訳を駆使しまくってますけど、上記の自動文字起こしを試してみて、これ(に限らずIT、ICT全体)は、スマホ辞書の「トンネル・デザイン」やAIによる自動通訳翻訳などと相まって、私たちの語学学習に壊滅的な影響を与えるかもしれないと思いました。

トンネル・デザインについては以前「紙の辞書 VS. 電子辞書」に関してこんな記事を書きました。

プログレッシブ中国語辞典』第二版の巻頭言で、編者氏が「トンネル・デザイン」の危険性を指摘されています。いわく「出発点から目標点に向かってトンネルを掘るような一直線の進み方をしたのでは、その課程で何も学ぶことはできないし、記憶するいとまがないことにも留意しなければなりません。入門・初級段階で身につけなければならない語彙は、本来的には調べて探し出す対象ではないのです」。さらっとすごいことを言っていると思います。初学段階では「分からない言葉がある→辞書を引く」というのは本質ではないと。初学者にとって辞書は、まずは大いにあちこち泳ぎ回ってみるべき大海原みたいなものなんですね。
辞書の使い方・選び方セミナー - インタプリタかなくぎ流

語学ってもとより地道(じみち)な作業が大切な分野ですけど、その地道な作業がこうも軒並み陳腐化していっては……単に私の思考方法が古いだけなのかもしれないし、杞憂であってほしいとも思いますけど。