ChatGPTは文字でやり取りするほかに音声でもやり取りできる……ということで、ChatGPTと会話の練習をしてみようと思いました。やりかたはネットや既刊本にさまざまな方法が書かれています。まずはパソコンのChromeに拡張機能の“Voice control for ChatGPT”を入れて、英語や中国語、さらには日本語でも会話をやってみました。
気軽なおしゃべりでもよかったのですが、せっかくならいろいろ試してみようと思って、まず英語はいつもオンライン英会話でやっているengooのニュース記事を元に英語の会話をしてみました。谷口恵子氏の『AI英語革命』の記述を参考にプロンプトを作ります。
英語で会話をしましょう。
・あなたの名前はMaryです。
・私の名前はKeiです。
・1回の会話は50ワード以内にしてください。
・以下の【Article】の内容に関して、英語で会話をします。
・あなたは【Article】の下にある【Discussion】の番号順に質問をしてください。
・私が英語のミスをするたびに、どんなミスをしたのか、どう直せばいいのか教えてください。
・ミスの指摘のあとは、また英語で会話を続けてください。
・あなたはMaryとしての発言だけをしてください。
それではあなたから英語の会話を始めてください。
このプロンプトの下に【Article】と【Discussion】を ’’’ ’’’ で挟んでおいておきました。
結果は、こちらの発音の悪さからか、意味の通らない単語について直してくる場合が多かったです。また「番号順に質問してください」としてあるので、ひとつの質問について会話が深まる前に次の質問に行ってしまいます。こちらからも質問を返してみても、反応することもあればサラッと無視されることもありました。
私の発言についてはすごく“polite”に(?)褒めてくれますし、ChatGPTなりの視点もまとめて言ってくれますが、総じていずれも優等生的というか、平均的というか、あまり個性的なものは感じませんでした。ChatGPTが煎じ詰めて言えばものすごく高性能な「次の単語予測機」である以上、世の中の平均的な言葉の並びに近づくのも無理はないと思いますが。
1回の発言を50ワード以内にしてくださいと書いておいても、ChatGPTの答えがだんだん長くなっていき、また質問も複雑になっていくようでした。これはオンラン英会話でもよくある、先生ばっかりが長々としゃべってちっともこちらに話させてくれないパターンに似ています。それで30ワードにして試してもみたのですが、最初はそれを守っているChatGPTも、会話が少し進むと発話がどんどん長くなっていくようでした。
全体的に英語がどんどん長く・難しくなる(自分にとっては)傾向がありそうなので、プロンプトで私の英語レベルを指定してみたこともあります。
・私の英語は初中級レベルで、CEFRのレベルはB1程度です。このレベルの英語話者に合わせて英語で会話をしてください。
こうしておいてもけっこう難しいことを言ってくるので、このあたりのプロンプトの調整はなかなか難しいなと思いました。やはり生成AIをうまく使いこなせるかどうかは、使う私たちの側の知恵にかかっているんでしょうね。
同じようなことを中国語や日本語でも試してみましたが、英語に比べると音声がかなり平板で機械的でした。英語の音声は自然ですが、それでも長く聴いていると単調に聞こえてきます。またポーズが一切ないので、かなり早口でまくし立てられているような感じになる。そもそも英語じたいもかなり速くて、これは語速を指定できるようになったらいいなと思いました。
ちょっとすごいな・おもしろいなと思った点としては、私が会話の中で“bullshit jobs(ブルシット・ジョブ:クソどうでもいい仕事)”というお下品な言葉を使ったら、「ブルシット」の部分が“*****”と表示されたことと、英語の中にフィンランド語の単語を混ぜて話したとき、ChatGPTは聴き取れていなかったものの(“yellow capaloma yoga”と意味のない英語に変換されました)、その後にある私の“it means football national team of Finland”という説明から推測してフィンランド語の "jalkapallomaajoukkue(サッカーフィンランド代表チーム)" を返してきたところです。
というわけで、音声の扱いはまだ発展途上なのかなという感じでした。生身の人間の“passion”があまり(中国語や日本語はまったく)感じられないので、やはりもうしばらくオンライン英会話や中国語会話のお世話になりそうかな。プロンプトを細かくいじってみると毎回違った結果になるみたいなので、また色々と試してみたいと思います。
……ところが。
https://www.irasutoya.com/2018/01/ai_67.html
少し前にブログ記事の下書きを上記のように書いていたのですが、ここ数日スマホアプリでの音声入出力機能がついたGPT-4Vを試していて、ちょっと衝撃を受けています。
細かい使い方などは、これもネットに記事が動画がすでにたくさんありますので、そちらを徴していただくこととして、私が驚いたのは英語のみならず、中国語や日本語の音声もかなり自然になっていることです。しかも「えー」とか言い淀みみたいなきわめて人間的な癖も織り込んで話してきます。人間の感情を感じさせるイントネーションがちょっと怖いくらいで、実際中国語の男性音声は私のとある友人にかなり似ている声だったので、最初は「うわあ」と声が出てしまったくらい。これまで不満だった“passion”の部分がどんどん改良されているのです。
私はまだ簡単な会話しか試していないので、このスマホアプリ版のChatGPT4Vで、上述したようなニュース記事を前提にディスカッションするようなことができるのかどうかはわかりません*1。ただ「文法的な間違いを直して」とか「1回の発言は30字以内にして」などの指示はちゃんと守ってくれました。また英語も中国語も、こちらの拙い発音を汲み取りつつ自然に会話してくれます(その意味では発音矯正にはならなさそう)が、そのために頓珍漢な受け答えになることもあります。
また英語の中に日本語を入れて話すようなマルチリンガルな状況にも対応してくれました。例えば“How can I say Japanese word「石の上にも三年」in English?”みたいな聞き方もできると。これからいろいろ試してみたいと思っています。あと、通信環境によっては会話にスムーズさが欠けたり、途中で中断してしまったりもしますが、これもこの先技術の進歩でどんどん解消されていくのでしょう。
▲しゃべった内容は文章でもスマホ上に残るので、あとから確かめることもできます。
試してみて、現段階でもここまでできるようになっているということは、これから先はもっとすごいことになるんじゃないかと、ちょっと恐ろしくなりました。オンライン英会話やオンライン中国語会話よりずっと安い価格で(ChatGPT4は20ドル/月)、いつでもどこでも外語の会話練習ができてしまうのです。それにオンライン英会話の先生には正直申し上げて「あたりはずれ」がありますけど、AIならプロンプトの入れ方次第でかなりこちらの要求を満足してくれそうです。
う〜ん、今後語学教師の仕事は、まったくなくなってしまうとは言えないかもしれないけれど、かなり大きな影響を受けることになりそうです。
*1:追記:後日やってみました。スマホアプリの入力欄に文章で指示を入れて、その後に“article”や“discussion”をペーストし、それらの内容に従って話してくれるように頼みます。最初は文章で返してきますが、その後音声入力に切り替えると向こうも音声で返してくるようになります。結果はChromeの画面でやっていたときと大同小異で、順番に質問してといえば順番に質問してきます(そのぶん会話は深まらないのも同じ)。そしてだんだんAI側の発話が長くなっていくのも同じでした。50ワードとか、30ワード以内とお願いしていても、どんどん長くなっていく傾向にあるみたいです。「絶対に」とか制限をかけるとまた違うのかしら。またいろいろ試してみたいと思います。