webライティングを行っていると、いかに分量を多く、早く書くかは一つの課題となります。
書く内容なコンテンツにもよりますが、あまりきっちりと書かないで良い文章や、頭の中に話せるくらい熟知しているネタがあるなら、音声認識の機能を使った方が効率が良い場合も出てくるでしょう。
ただ、siriにせよ、google docsなどのgooogle音声認識にしても、以前に比べると明らかに進化していますが、当然100%までの精度まできたいするのはちょっと厳しいですし、音声認識独特の認識癖を意識しながら発話をしないと、変な位置で点が入ったり、意図しない変換になったりすることは多くあります。
その点は、これからという気はします。
とはいえ、音声認識などの各種認識機能の精度向上は、年々改良されていると体感します。
以前の音声認識システムは、話者がいくつかの単語や会話を話し、システムに声の話し方や特徴を学習させなければなりませんでした。
しかし現在は、事前の学習なしでも、不特定多数の音声を認識できるようになってきています。(会話が重なっているときは誤認識も起こりますが)
会議や講演会の書き起こしのドラフトなども、大枠は音声認識に任せ、誤字脱字や句読点は人間が処理していく、そのような形に変わっていくのも近いでしょう。
それくらい、現在の音声認識の進化は進んでいると感じます。
コメント