てつさらです。

私は取材で、インタビューを録音して、あとでそれをテープ起こしして、それをもとに原稿を書くという仕事をすることが多いです。

そのテープ起こしの際に、音声認識のソフトを使っています。ただし、録音したデータをそのまま認識させてもほとんど認識ができないので、一旦私がその録音音声を聞き、その内容を私がマイクで発音しなおして、それを認識させているのです。

具体的に私が使っているのは AmiVoice2というソフトです。このソフトの場合、認識の精度は、80~90%ぐらいでしょうか。

私はブラインドタッチができないので、手で入力するのがすごく遅いのですが、この音声認識ソフトを使うとかなりその労力を省くことができます。多分、時間にして3分の1ぐらいになるでしょうか。そういう意味では音声認識はとても便利なツールです。このブログの記事も、音声認識ソフトで入力しています。

しかしそれに慣れてしまうと、手で入力するのが非常に億劫になってしまいます。そうするとちょっと困ったことが起こるのです。純粋にテープ起こし用として音声認識ソフトを使うのは全く問題ないのですが、ブログの記事のように、自分の頭で考えた内容を口に出して言うというのは、結構難しいのです。思考内容を音声化するときに、通常使わないような回路を使うため、なかなか考えがまとまらない感じがします。しゃべっているうちに、何をしゃべっていたのかがわからなくなってしまうことがよくあるのです。

同じ言語を喋るのでも、自分の考えを誰か目の前にいる人に伝える場合とは明らかに違う回路を使っているような気がします。普通の伝達の場合は、喋っていて考えがまとまらなくなるということはほとんどないのですが、音声入力ソフトに向かって自分の考えを伝える場合には、なかなかうまくいかないことが多い。(よく口述筆記で小説などを書く人とかがいますけれども、私には本当に信じられない方法のような気がします。)

その辺のことは、自分の考えをキーボードに直接打ち込む時の方が、うまくいくような気もしています。もしかしたら思考と親和性があるのは、口から出る言葉ではなく、手を伝って表現される言葉なのかもしれません。

これは、単純に慣れの問題だけなのかもしれませんが…。

その辺は今年の課題としても考えてみたいです。音声認識ソフトを使って、より直接的に自分の思考を表現できる方法を…。

以上、てつさらがさらっと書きました。