インタプリタかなくぎ流

いつか役に立つことがあるかもしれません。

Adobe Premiere Proで文字起こしができちゃった

仕事柄、通訳教材を作るときや自身の語学の勉強のためにも、よく外語の動画や音声の「文字起こし」を行っています。いわゆる「ディクテーション(中国語:聽寫)」というやつです。その昔は「テープ起こし」などと称していて、文字通りカセットテープに録音された議事録などを文字にする仕事もありました。

ソニーが作っていた「BM-76」というテープ起こし専用デッキ(トランスクライバー)があって、これでカセットテープを再生しては書き取って巻き戻し、再生しては書き取って巻き戻し……という作業を繰り返していたのです。再生と巻き戻しはフットスイッチで行うことができ、スイッチを足で踏んでいる間は再生、足を離すと任意の秒数だけ自動で巻き戻してくれるという機能がついていました。これでハンズフリーになり延々文字を書き取り続けることができるというわけ。


SONY BM-76 - Google 検索

それからほどなくしてパソコン上に「文字起こし」環境を構築できるようになりました。このブログでも何度もご紹介していますが、WindowならフリーソフトのOkoshiyasu2を使って、Macならマクロを使って、いずれもBM-76と同じような環境でディクテーションができるようになりました。これでどれだけの中国語を聴き取ってきたことか。その過程でリスニング力や語彙力が鍛えられたと感じているので、学生さんたちにも絶賛オススメしてきました。

qianchong.hatenablog.com

ところがその後、Google Documentの音声入力機能を使って、自動でディクテーションができるようになりました。パソコンで鳴っている音を認識させるために、WindowsMacともに出入力デバイスを操作する必要がありますが、かなりの精度で文字起こしをすることが可能に。こうなっちゃうともうあの「泥臭い」ディクテーションには戻れなくなってしまいます。よほどの意志がなければ、学生さんだって取り組もうとは思わないでしょう。

qianchong.hatenablog.com

そしてAIの技術が急速に日常のものとなって行きつつある現在、当然のように文字起こしもできるようになっています。ChatGPTに動画や音声のファイルを丸投げして「文字起こししてください」とお願いしても「音声ファイルの変換はサポート外の操作となります」と今のところはやってくれません。でもいくつかのソフトでは可能らしく、例えばこちらの記事ではAdobe Premiere ProでAIを用いた文字起こしができると書かれています*1

toyokeizai.net

Adobe Premiere Proは以前から使ってきたのに、知りませんでした〜! マニュアルをよく読め、ということですね。それで試してみたら、ほんのわずかの手順と時間で文字起こしが終了してしまいました。上述のGoogle Documentを使った方法では、基本的に5分の映像や音声なら聴き取って文字起こしするのも5分かかるわけですが、Adobe Premiere Proの文字起こし機能ではそれが超高速で行われます。

この画面では先日のアメリカ議会上院で行われたSNS上の有害なコンテンツから子どもを守る対策についての公聴会のニュースを試しています。マーク・ザッカーバーグ氏の部分で社名の「Meta」が聴き取れていないなど若干の誤記はありますが、おおむね正確に文字起こしされてしまいました。そう、「されてしまいました」。ここまで来ちゃったんだもの、これでもう未来永劫、学生さんたちは泥臭い作業に勤しむことはなくなるだろうなあ。

かくいう私自身が、趣味と実益を兼ねてあんなに好きだったディクテーションに対して、モチベーションを鼓舞するのが難しいと感じちゃっています。AIが語学に革命を起こしつつあるのは確かなんですけど、それは決してプラスの側面だけではないなと改めて感じています。というか、外語の学び方に対して、これまでとはまったく違う発想のアプローチが求められていくということなのかもしれません。

*1:具体的な使い方については、こちらの記事もとても参考になりました。ありがとうございます。