2015.06.23テープ起こしと音声認識

第1回VoXTグランプリ~リスピークについて社内で検証をしてみました。~

Pocket

今日は、私たちVoXTチームが密かに温めていた、「VoXTグランプリ」の決行日!

と言っても書き起こしの手法としてリスピークがどうすれば浸透するのかということを話しているうちに、とにかくまずは、社内でリスピーク大会をやってみよう、なんだか楽しそうだし、やってみることに意義がある、などと盛り上がり、そのままの勢いで今日を迎えました。

リスピークについて社内で検証

ちゃっかりロゴも作ってしまったので(笑)みなさんがんばりましょう。参加者も絶賛募集中です!

そして、記念すべき「VoXTグランプリ 第1回」のメンバーは、志村、満山、川嶋、鶴田、小泉の5名に決まりました。普段、VoXTの営業、マーケティング、書き起こし実務に関わっているメンバーです。
ルールはいたって簡単。同じ音声ファイルを聞きながら、皆で一斉にリスピークをするだけです。知らない方のために、念の為にご説明を・・・リスピークとは、ヘッドホンから聞こえてくる音声を、自分の声でしゃべり直して音声認識を行う、書き起こしの手法です。どれだけVoXTで認識できるか、シンプルな形でトライしてみることになりました。

キーボード入力禁止の音声認識のみの勝負です

「えっ、全員同時にリスピークしたら、隣の参加者の音声が聞こえてしまって、自分が聞きたい音声が聞きにくくなるよね?」・・・まあそういうことも考えられますが、今回は気にしない事にします。それをうまく使うのも作戦のうちってことで・・・。
正しく認識してくれるまで何度も削除してしゃべり直していたら、みんな認識率が上がるため、じゃあ、時間制限を設ける事に。今回の制限時間は、音声ファイルの3倍長さに設定しました。あとキーボードで文字を入力するのはNGという条件で、誰がうまくリスピークできるかを競います。
それぞれの声で勝負!
ということで、時間制限はありますが、後は小細工一切なし!それぞれの声で勝負です!
そして制限時間の3分が終了。短い時間ですが、達成感がある表情ですね~。

認識率を測定して勝敗を決定します。

テキストスコアラー

「テキストスコアラー」。正解文章と音声認識結果を照らし合わせて認識率を計測できます。

認識率を測るのはテキストスコアラー!

今回は、句読点や表記等を含め、機械的に正解文章と照らし合わせて認識精度を計測することとしました。そのため、日本語として意味が通っていたとしても正解文章と少しでも違いがあれば減点されます。正解文章も話し言葉を人が書き起こしをしているのですこし曖昧です。

見ての通り認識率が70%でも意味が通じるときもあります。一方、否定が肯定になってしまうなど、認識率は95%でも意味がまったく違ってしまうという事もあります。認識率は非常に重要な指標ですが、認識率よりも意味が通じるかという事が重要だと改めて感じました。

結果をみると見ると、ずいぶんと差があります。そもそも3名は3分以内に終わりませんでした・・・。聞く箇所を間違えた、入力箇所を間違えた、時間配分を間違えたという、なんとも微妙な理由です。3分以内に終わらなかった人は失格としました。

ちなみに認識精度の算出する図式は下記の通りです。とても厳密にやっています。

認識精度を算出する図式

果たして第1回目の優勝は?

VoXTのマーケティング担当者

入社3年目の鶴田さん。「VoXTのことは任せてください。」

VoXTのマーケティング担当 鶴田さんでした!

とにかく一気にしゃべったのが勝因だったようです。認識率は76.5%でした。2位の川嶋さんとの差は2.21%と僅差でした。直接音声認識したのではなくわざわざリスピークでしゃべり直して認識率76.5%ってどうなんでしょう。正直、この数字を公表すると、VoXTのマーケティング上逆効果ではないかと思いました。その上で、この76.5%の認識結果を細かく確認してみました。

認識率は、76.5%ですが文章としては、ほぼ意味は通じています。ただ、句読点の位置が少し違ったり、表現の仕方が違ったため、機械的な認識精度で算出したため、このような結果となりました。

対象の音声の選定と認識率の算定方法等、次回に開催に向けて課題も明確になりました。いつも9割超の認識率をたたき出している人が意外にうまく出来なかったり、突如PCのトラブルに見舞われたり、勝負の際にありえそうなトラブルも出てきました。

VoXTは自分の声で、高速に音声データをテキスト化する仕組みを追い求めています。お客様にご利用頂く為にも、自ら試行錯誤して使ってみるというのはあらためて重要だと感じました。

次回はご利用頂いているお客様も招いてVoXTグランプリが開催できればと思います。我こそは!と言う方は是非お声がけください。皆さんのご参戦、お待ちしております!

  • このエントリーをはてなブックマークに追加

▼文字起こしなら、VoXTにお任せください!▼

 VoXTアプリを利用すると、録音データの聞きなおし、文字起こしが効率的に行うことが可能です。又、マイクを通した明瞭な音声であればVoXTセルフの音声認識でテキスト化することも可能です。雑音が多く認識が難しい場合は、VoXT音声入力で復唱することで、簡単に文字起こしが行えます。レポートの作成時などに活用できます。


WP_bnr_under
The following two tabs change content below.
編集部
このブログの編集部です。 音声文字起こしに関する最新情報などを発信していきます。