2015.04.16テープ起こしと音声認識

廿里美のリスピークコラム 第1回「音声認識を活用したテープ起こしとは」

Pocket

はじめまして、廿里美(にじゅうさとみ)と申します。音声起こし(テープ起こし)の仕事をしています。

音声起こし,テープ起こしとは、講演や会議などが録音された音声を聞きながら、その発言を正確に文字化する仕事です。もちろん原稿用紙に手書きではなく、パソコンの文書作成ソフト(Microsoft Wordなど)に文字を入力します。この仕事を始めて17年目。年齢のせいか、キーボードを打ちまくるのがきつくなってきました。そこで、ここ数年は音声認識を活用しています。

◆録音状態がいまいちならリスピーク(復唱)で文字化

タイピング作業は労力がかかり、早くタイプできるまで時間がかかる

タイピング作業は労力がかかり、早くタイプできるまで時間がかかる

パソコンに向かい、ヘッドホンマイクを装着して、音声ファイルを聞きます。音声の中の発言内容を言葉通りに、マイクに向かって自分でもう一度しゃべります。こうやって復唱して認識させることをリスピークといいます。

「わざわざリスピークしないで、音声ファイル自体を自動で文字化させられないの?」と、よく質問されます。

条件が合えば、できます。うまく音声認識されるのは、「一人だけの話者」「マイクと口元の距離が5センチ程度」「ある程度明瞭な発音」の録音です。私の仕事はインタビューやマイク無しの会議などの音声が多く、自動では認識されにくいため、リスピークのほうが有効なのです。

「手術」ってうまく言えますか

リスピークも最初は認識されない部分が多くて、「声が小さいのかも?」と必死に大きな声を出したりしていました。これは私がリスピークのコツをつかんでなかったせいです。今は、電話でしゃべるときより小さいぐらいの声でリスピークできています。

 「そういえばタイピングも、最初はキーボードの文字を1字ずつ探しまわった…」

そうです。タイピングと同様に音声認識も、ちょっと慣れや練習が必要なのです。ただ、タイピングと違うのは、音声認識側にも練習期間が必要というか、音声認識側もユーザーの発音に慣れなければいけないことです。

発音というのは、厳密には一人ひとり違います。例えば鼻濁音を使う人もいれば使わない人もいます。「手術」などの発音しにくい言葉では、「しゅじつ」「しじゅつ」「しゅーつ」といろんな発音になったりします。

◆音声認識とユーザーはロマンチックに理解しあう

しばらく使っていくうちに、使う側は音声認識されやすいしゃべり方を覚えます。その間に、音声認識側もユーザーの発音の特徴を覚えていきます。ユーザーと音声認識が、お互いを育て合うというか、お互いを発見し合うわけですね。

音声認識がうまく「手術」と文字化してくれると、「こんな発音なのに分かってくれたのね、ありがとう」と、なんだかふんわりした気分になったりします。

…と、余裕の発言ができるようになるまでには、「音声認識が存在しているのに使えない」という時代もありました。次回はそのお話をいたしますね。

著者紹介
廿里美(にじゅうさとみ)株式会社エフスタイル
廿里美(にじゅうさとみ)

10年間の在宅ワーカー生活と現在の株式会社エフスタイル勤務を通して、音声起こしの実務に携わる。また、音声起こしの未経験者をプロに育て、在宅ワーカーとして活躍する機会を提供する活動を続けている。

2007~2010年、厚生労働省委託事業・日本生産性本部主催の「在宅ワーク就業体験」でテープ起こし講師。現在、NPO法人フラウネッツ「オンライン講座テープ起こし初級」「本気チャレンジ音声起こし」講師。テープ起こし・音声起こしの総合情報サイト「okoso」を監修。

著書は『テープ&音声起こし 即戦力ドリル』(エフスタイル)のほか、「ひとりで学べる音声起こし教材【中級1】素起こし+軽い整文」「ひとりで学べる音声教材 社内会議の議事録」(いずれもダウンロード販売)がある。

  • このエントリーをはてなブックマークに追加

▼文字起こしなら、VoXTにお任せください!▼

 VoXTサービスでは、音声認識を活用してご自身での文字起こし作業を支援するサービスです。リスピークが誰でも簡単に出来る「VoXT音声入力」。音声ファイルをそのまま音声認識してテキスト化する「VoXTセルフ」2つの音声認識を活用したサービスでテープ起こしを支援します。テープ起こしでお悩みの方は一度お問い合わせください。


WP_bnr_under
The following two tabs change content below.
編集部
このブログの編集部です。 音声文字起こしに関する最新情報などを発信していきます。