音声認識

よろしくお願いします。

今日は普段よりも寒いですね。雪が降ってきたのではないでしょうか。外を見るとやはり雪が降っているようです。真っ白な世界が僕の目の前に広がってきました。寒すぎてすぐに引きこもってしまいましたが。

さて、こんなどうでもいい話はここまでにして今日は音声認識についてやっていきたいと思います。この記事を見て、普段スマートスピーカーに話しかけてるからできると思い試してみました。

note.mu

何を隠そう、この本文も音声認識を使って書いているわけです。何のことはありません、スマートフォンのキーボードから音声認識のボタンをクリックして喋るだけです。簡単です。

簡単ですが、普段書いてる内容とは文調が変わってきますね。ぼくは真面目な話については漢字をわざとたくさん使った文章を書いているのですが、音声認識だとそれは難しいです。なぜ難しいのかと言うと言葉が出てこないのです。文章につながりを持たせようとして、平易な表現を使ってしまいがちです。やっぱり文章によって音声認識が適したものや適していないものがあったりするのです。

例えば文章を推敲しなくてはいけないような記事、新聞記事のようなものですね。あの辺はとても難しいと思います。またこれは僕のくせかもしれませんが、「あれ」や「それ」と言った代名詞が多くなってしまいます。なんだかんだ言って入ってしまってるのではないでしょうか。また、文章中の記号なども後から書くことになってしまいます。ほかにも、どう言えば文章として成り立つかというものも少し考えなくてはいけないようになってしまうようです。

このことに関しては音声認識を使ったもの全般に言えるものですね。家で使っているスマートスピーカーGoogle Home miniでも最初に頭で言いたいことを考えてから喋るということがままあります。

これが良いか悪いかはともかくとして、頭の体操になるような気がします。人との会話でもどうやればよく伝わるかということは考える必要がありますよね。文章でしっかり喋っていると思っていても、実際に文字で起こされてみると全然違うというものがあったりします。

ここまで、悪いことをつらつら並べてきましたがいいことはそのほか全部だと思ってもらっていいと思います。不満は言語化しやすい一方、満足している部分はわざわざ声を上げません。世の中、大きな声をあげるのはごく一部の人だということと同じように。

先程の記事では2000文字5分編集10分と書いてありましたが、ぼくは1000文字15分編集25分でした。その域に達するのはまだまだ先のようです。何にせよ一長一短、いい物はいいように使い、適していないものは他で対応するということが一番良いのではないでしょうか。サイレントマジョリティーを聞きながら喋っていました。それではまた。