2015.04.20テープ起こしと音声認識

廿里美のリスピークコラム第3回「音声認識を上手く行うコツ」

Pocket

私の普段のしゃべり方は、あんまり口を動かしていないようです。唇をできるだけ動かさずに「あんまり口を動かしていないようです」と言ってみてください。「んま」のところはいったん唇を閉じないと発音できませんが、それ以外はかなり小さい口の動きでも言えてしまいますね。

唇を上下左右に動かそう

じゃあ次に、同じ言葉をアナウンサーになったつもりで明瞭に言ってみてください。ただし、アナウンサーであってレポーターではありません。

レポーターさんは感情を込めて「あんまり…口を!動かしていないようです!!!」というようなしゃべり方をします。でも、音声認識は淡々と発音するほうが良い結果になります。退屈な政治のニュースでもアナウンスするつもりで、ただし唇は上下左右にしっかりと動かすと文字化されやすいようです。

先日、VoXTをちょっと試用させていただきました。初めて使うバージョンですから、私のしゃべり方のデータは蓄積されていません。

最初の5分ぐらいは「そんなこと言ってない!」という変な文字が出てきました。けれども次の10分ぐらいでもう、音声起こしの仕事に普通に使えそうなぐらい、認識されるようになりました。

音声認識ソフトを使い出したころ認識されにくかったのは、やっぱり唇を動かしていなかったせいだろうと思います。

◆最初は諦めるのもコツのうち

音声認識を上手に行うコツ

音声認識を上手に行うには、ヘッドセットマイク等口元に近い位置でマイクを使うことが重要です。機械に対してしゃべるという意識をせずに自然に発話することも大切です。

仕事に使えるぐらい認識されるといっても、マイクに向かってしゃべった言葉が全部カンペキに文字化されるというわけではありません。言葉によっては単語登録も必要ですし、自分の発音がもつれて言い直しになることもあります。

候補が出てこない言葉もありますが、使い始めのころはさっさと諦めてキーボードでタイピングしたほうがスピーディーです。そのうち候補に出てくることがあります。

「分かる」という漢字を使いたいのに「わかる」「解る」「判る」しか候補が表示されず、イライラしていたら、数日後に「分かる」が出るようになったことがあります。その後、「分からない」「分かります」などの活用形も問題なく出てくるようになりました。どういうロジックで候補が表示されるのか、ナゾですね…。

◆「箸」と「橋」は区別されない

意外なことに、現在の音声認識では、高低アクセントは認識に影響しないそうです。「感じ」と同じ高低の「漢字」が候補に表示されるのは理解できるとして、高低アクセントの違う「幹事」や「監事」も候補に出てくるのです。

考えてみれば、高低アクセントは地域や世代で少しずつ違いますものね。箸と橋の違いで苦労するぐらいなら、音の高さ無視で「はし」だけ聞き取ってもらうほうが、合理的なのかもしれません。

そしてこれも意外なことに、くだけた会話や関西弁トークなども結構よく文字化されます。くだけた会話でも関西弁でも、とにかく感情を込めたり抑揚を付けたりしないこと、棒読み的に淡々と、唇だけはきちんと上下左右に動かして、というポイントは同じです。

音声認識のやり方は分かってきたものの、私の仕事は音声起こし(テープ起こし)です。他人のトークを聞きながら、その内容を正確にリスピーク(復唱)しなければなりません。「聞く」と「話す」の両立は難しくて…。次回はそのお話です。

 
著者紹介
廿里美(にじゅうさとみ)株式会社エフスタイル
廿里美(にじゅうさとみ)

10年間の在宅ワーカー生活と現在の株式会社エフスタイル勤務を通して、音声起こしの実務に携わる。また、音声起こしの未経験者をプロに育て、在宅ワーカーとして活躍する機会を提供する活動を続けている。

2007~2010年、厚生労働省委託事業・日本生産性本部主催の「在宅ワーク就業体験」でテープ起こし講師。現在、NPO法人フラウネッツ「オンライン講座テープ起こし初級」「本気チャレンジ音声起こし」講師。テープ起こし・音声起こしの総合情報サイト「okoso」を監修。

著書は『テープ&音声起こし 即戦力ドリル』(エフスタイル)のほか、「ひとりで学べる音声起こし教材【中級1】素起こし+軽い整文」「ひとりで学べる音声教材 社内会議の議事録」(いずれもダウンロード販売)がある。
 

  • このエントリーをはてなブックマークに追加

▼文字起こしなら、VoXTにお任せください!▼

 VoXTサービスでは、音声認識を活用してご自身での文字起こし作業を支援するサービスです。リスピークが誰でも簡単に出来る「VoXT音声入力」。音声ファイルをそのまま音声認識してテキスト化する「VoXTセルフ」2つの音声認識を活用したサービスでテープ起こしを支援します。テープ起こしでお悩みの方は一度お問い合わせください。


WP_bnr_under
The following two tabs change content below.
編集部
このブログの編集部です。 音声文字起こしに関する最新情報などを発信していきます。