2011年2月24日木曜日

これだけは気をつけろ! 「テープ起こし」虎の巻

 取材やインタビューの経験がある人はご承知のことかと思うが、人間が話す内容をリアルタイムにテキストに起こすのはなかなか難しい。超がつくほど高速なタッチタイピングの技と、極限まで鍛え上げたIMEと、手にしっかりなじんだキーボードがあったにせよ、等倍再生で日本語の会話をテキストに起こすのは、プロのライターにとっても至難の業だ。頭の中で次の質問を組み立てながらとなると、なおさらだ。

【拡大画像や他の画像】

●取材やインタビュー、会議の議事録作成などで必須の「テープ起こし」

 こうした場合、内容やスケジュール、予算にもよるが、会話の内容を録音した上で「テープ起こし」として専門業者にアウトソースするという選択肢も考えられる。もちろん時間をかけて自力でテープ起こしをする方法もあるが、複数の案件がバッティングするような状況においては、テープ起こしの作業は、アウトソースが可能な唯一の工程でもある。外注に任せることで自分は別の作業に注力するという選択肢も、候補の一つとして持っておいてよいと思われる。取材やインタビューだけでなく、会議の議事録作成や全体朝礼における社長の講話のテキスト起こしなどについても同様だ。

 もっとも、およそ1分200円前後といわれる単価に見合った成果物が得られるのかどうかは、実際にやってみないと分からないというのが正直なところだ。ばく大な時間と費用を費やした結果、自力で行うのに比べて著しく低いクオリティであれば、そもそも外注に出す意味がない。また業者の当たりはずれも、1回きりの発注ではなかなか判断しづらい上、仮に複数の業者を比較するにしても、異なる音源データをもとに判断するのはナンセンスだ。比較するのであれば同一の音源データで比較しないと意味がない。

 そんなこともあり、仮にテープ起こしの外注に興味を持つ立場であっても、実際に依頼した経験は皆無という人が大多数ではなかろうか。かなりニッチな分野での話であり、関係ない人にはとことん関係ない話だろうが、筆者の周囲でもテープ起こしを外注に出してみたいと漏らすライターや編集者は多い一方、実際に出してみたという話はほぼ聞いたことがないのが現状だ。

 そこで今回は、1本の音源データをもとにしたテープ起こし作業を、専門業者3社に同時に発注し、そのプロセスや納品物のクオリティを比較することで、テープ起こしをアウトソースする場合のコツを探ってみたい。

●テープ起こしの基礎である「素起こし」「ケバ取り」「整文」とは?

 本論に入る前に、まずはテープ起こしに関する基礎知識についてまとめておこう。

 ネットで「テープ起こし」といった語句で検索すると、さまざまな専門業者のページがヒットする。どの業者も加工の度合いによって詳細な料金プランを設けているが、いちばんベーシックなのは「素起こし」と呼ばれる、インタビュー音声をそのままテキストに起こすプランだ。「素起こし」では、会話に含まれる「あー」とか「えー」といった発声もそのまま書き起こされる。つまり聞いたままの内容がテキストになると考えるとよい。今回選択したのもこのプランだ。

 「あー」「えー」などを取り除いて整形された状態にしてくれるのが「ケバ取り」と呼ばれるプランだ。喋り方のクセにもよるが、人によっては素起こしのままだと発言にまったく意味が通っておらず、ケバ取りをしてようやく言わんとすることが理解できるといった場合も少なくない。業種にもよるが、会議やセミナー、各種インタビューでは、この「ケバ取り」が事実上の標準になると考えてよい。

 さらにケバ取りをしたテキストを、喋り口調ではなく文章として記述したかのような文体に書き直し、意味が通る文章にしてくれる「整文」なるプランもある。例えば芸能人やスポーツ選手が出版している自伝は、本人が喋った内容を録音してテキストに起こし、書籍としての体裁を整えるケースがほとんどだが、ケバ取りだけで意味が通る文章に仕上がることはまずないので、意味が通るように整文化し、さらにゴーストライターが手を加えることになる。どこまでしっかりとした文章に整形するか、口語をどの程度残すかといった整文の"程度"については、ケースバイケースで交渉することになる。

 主なプランは以上の3通りで、料金はほとんどの場合、「素起こし=ケバ取り<整文」となる。ケバ取りも編集作業が必要なので料金が加算されるかと思いきや、たいていは素起こしと同一料金だ。素起こしを厳密に行おうとすると「あー」「えー」などもすべて書き起こさなくてはならず、むしろ手間がかかるため、業者的にはむしろケバ取りのほうが歓迎されるようだ。いっぽう、編集の手間がかかる整文については、ケバ取りの基本料金に追加料金が上乗せされるという寸法である。

 もっとも、実際には各社ごとに、および実作業を行う担当者によって、かなりの認識の違いがあるのが現状だ。素起こしのつもりで依頼したらケバ取りに近い状態で上がってくる場合もあるし、その逆もある。担当者の癖はもちろん、会話の主の喋り方の癖に引きずられて内容がブレる場合もある。

●3社とのやり取り、発注から納品までがすべてネット上で完結

 では、各社に発注してから納品されるまでの数日間のやりとりを見ていこう。テストの方法は冒頭に記したように至ってシンプルで、インタビューを録音したMP3データを、3社のテープ起こし業者に同時に発注するというものだ。発注はすべて同一営業日に行った。

 対象のテープ起こし業者は、ネットで検索して得られた情報をもとに、条件に合致する業者をチョイスした。条件とは以下の3点である。


1. 発注から納品までがすべてネット上で完結すること
2. 今回の音源データ(約75分)のテープ起こし代金が2万円以内であること
3. 個人事業主ではなく、会社形態であること

 プランについては各社とも「素起こし」をチョイスしている。音源データの内容はインタビューで、ジャンルはIT系である。翻訳などの作業は伴わない。

●いつまでに入金すればいいの? ――コエラボ

 1社目はIPパートナーズが運営する「コエラボ」。サイト上には「1分190円?のテープ起こし」とある。

1営業日目: サイト上のフォームから申し込む。後述の2社と違って受付確認のメールがなく、数時間後の夕方になっていきなり見積のメールが届く。金額は74分で1万4800円。1分あたり200円という計算だ。詳細な見積には音源データが必要なので送付するよう求められるが、具体的な手順がメールに記されておらず、同社サイトに戻って確認。紹介されている複数のファイル送信サービスの中から「データ便」を選んで音源データを送付。

2営業日目: この日の夕方になって音源データがダウンロードされたとのメールが着信。営業日ベースで丸一日も音源データが放置されていたことになり、やや悠長な対応に不安を感じる。

 音源データのダウンロードから数時間後、正式な見積メールが届く。この時点で「通常」と「特急」の2プランを提示される。特急であれば中3日(4営業日目)、通常であれば中5日(6営業日目)に納品可能とのこと。他社と比べると納期は短いが、今回は条件を合わせるため「通常」を希望する旨返信する。

 また、今回の3社の中で唯一代金の前払いを要求されたため、メールの返信と併せて指定口座への入金作業を行う。この際、メールの返信期日や代金の振込期日は明記されておらず、いつまでに対応すればオンスケジュールでの進行が可能なのかがはっきりしない。

4営業日目: 入金を確認した旨のメール連絡あり。

6営業日目: 納品日。夕方になってメール添付で納品あり。形式はWordファイル。追って領収書を郵送するとのこと。領収書は翌々日に到着。

備考 最終的にはスケジュール通りに納品されたが、メール着信や入金確認のメールがないなど、進行状況が見えづらい。また3社の中で唯一、全てのやりとりを通してメールに担当者名が記されておらず、窓口が不明瞭だった。

●ちょっと高めで時間もかかるけど、レスポンスはいい――東京反訳

 次は東京反訳。トップページ上に自動見積フォームを備え、料金と納期が手軽に確認できるようになっている。

1営業日目: サイト上の自動見積フォームから申し込む。受付確認のメールが届いた後もレスポンスはきわめて早く、申し込んで30分後には受付確認の手動返信あり。詳細な見積をするので音源データを送付するよう指示される。メールには具体的な手順の説明がなかったためサイトに戻って確認し、データ便にて送付。この時点で特急料金も提示されていたが、通常料金(ゆとり納期)を選択。通常料金での納品日は8営業日目と、他社に比べると2日余計にかかる計算。

 見積の結果は、74分で1万5540円。1分あたり210円という計算だ。了承する旨メールを送信したところ、追って「これから着手します」の連絡が届く。この時点で最初の申し込みからまだ5時間程度しか経っておらず、対応のスピードは極めて早い。

8営業日目: 納品日。夕方になってメール添付で納品あり。形式はWordファイル。支払いについての案内は特になく「またのご依頼をこころよりお待ちしております」と記載あり。

10営業日目: 請求書が郵送で届く。そのままオンラインで振り込みを行う。3日後に領収書が届く。

備考 メールの見落としが1回あったものの、レスポンスは全体的に良好で、やりとりをしていて不安は感じさせなかった。

●3社目は業界最安だったが……

 最後にC社。サイトには「高品質のテープ起こしを業界最安値(1分190円?)でご提供」とある。申し込みはスムーズだったが、指定納期の翌日になっても音沙汰がなかったため、最終的にキャンセルを通知した。参考までにやりとりを記す。

1営業日目: サイト上のフォームから申し込む。フォームメールがドメインの異なる外部サイトに飛ばされるもアナウンスがないなど、サイトの作りの時点でやや不安を感じさせる。受付確認メールはすぐに到着。

 申し込み後2時間で見積書が届く。金額は74分で1万4763円。サイト上には1分あたり190円と記しているが、ほかの2社と異なり税別表記のため、実際には1分あたり199.5円。当日中に音源を受領した場合、6営業日目の納品が可能とのこと。見積書には「検討ください」とだけ書かれており、次のステップが明示されていないなど、あまり商売っ気がない。

 次のステップに進むべくサイトを見ると、音源データを宅ふぁいる便で送るよう指示されている。容量の関係で宅ふぁいる便ではなくデータ便を使用する旨メールで通知したのち、音源データを送付。30分ほどあとにダウンロードされた旨データ便から通知あり。この日はその後連絡がなく、翌日(土曜日)の昼になって音源データを受領した旨と、これから着手する旨連絡あり。

6営業日目: この日が納品日にあたるが、連絡なし。

7営業日目: さらに翌日になっても営業時間後まで連絡がなかったため、メールでキャンセルする旨通知。数時間後に謝罪のメールとともに納品データが届く。先方曰く単純ミスで送信がもれていたとのこと。ちなみに6営業日目と7営業日目の間は3連休を挟んでいるため、実際には納品が丸4日遅延した計算になる。

 最後は、各社から納品されたテキストを比較しながら、傾向の違いをみてみよう。

●「聞き取れない用語の処理」に違いあり

 3社とも音源データの素材は同じながら、納品されたテキストの内容はかなりの差が見られた。とくに傾向の違いが見られたのは、聞き取れない用語の処理と、専門用語の扱い。また、ケバをどの程度残すかについても、はっきりと違いが現れた。各社のテキストを比較しながら傾向を見ていこう。

 正しい内容を記したテキストがこれ。着色してある個所は間違えやすいところを示している。

●「コエラボ」の納品データ

 着色個所はいずれも不正確だが、聞き取れた範囲で表記していたり、タイムスタンプが埋め込まれていることから、あとからの特定は比較的容易。

●「東京反訳」の納品データ

 ほぼ正しい内容。用語集に含まれていなかった「eSATA」の大文字小文字も正しく表記している。確定しない個所は「〓文字列〓」となっている。

●「C社」の納品データ

 聞き取れないと判断した個所をあっさりと放棄しているのが分かる。接続詞などは全体的に正確だが、このサンプル文章以外の個所ではケバが非常に多く読みづらい。

 コエラボの納品データは、後述の東京反訳に比べると細かい聞き間違いはあるものの、無理に既知の用語に当てはめようとせずに聞き取れた音をそのまま表記しているため、発注側が一読すればすぐに気づいて手直しでき、あまり大きな問題ではない。

 そもそも「素起こし」なので、この程度のもれはあって当然であり、東京反訳に比べ短納期であることも考慮すると十分に許容範囲だ。また、全く聞き取れなかった個所には「0:00:00」といったタイムスタンプが埋め込まれているため、あとから該当個所のみを聞き直しやすい点も評価できる。専門用語の再現性もそこそこ高い。

 東京反訳の納品データは、今回依頼した3社の中ではもっとも精度が高かった。素起こしでありながらほぼケバを省いた形でまとめられているため読みやすい上、聞き間違いがほとんどなく、あいまいな語句とそうでない語句もはっきりと区別されていることから、発注側としてもチェックしやすい。後工程をしっかり配慮している印象だ。また、こちらが事前に提供した用語集を参考に、関係する専門用語、例えば以下の例にある「eSATA」などを独力で探し当てた形跡があり、忠実な表記だったのには驚かされた。ほんの1カ所、100文字程度の会話がまるごと抜けていた個所があり、これが唯一のマイナス評価だ。

 納期に遅れた右下の「C社」は、良くも悪くも「素起こし」そのもの。「ええ」「はい」といった相槌を回数まで忠実にカウントしている一方で、聞き取れないと判断した名詞はあっさり放棄して黒丸(●)で表記するといった具合に、注力する個所が他社とはややズレている印象だ。

 せめてコエラボのように聞き取れた音だけでも書き残してくれれば後工程での修正は容易になるのに、と思う。また、2人の担当者が分担して作業を行ったのか、納品データの前半と後半でケバ取りの程度が明らかに異なっていた。分業そのものは問題ないとして、ケバ取りの程度を統一しないまま納品されるのは、後工程からすると困りものだ。ここの納品物をベースにすると、けっこうな手戻りが発生しそうだ。

 以上、音源データが同じでも、専門業者によって成果物にかなりの違いがあることがお分かりいただけたのではないかと思う。最後にまとめとして、テープ起こしの際の注意点をみていこう。

●「テープ起こしをアウトソースする際の注意点」はこれだ

 単純に今回の結論を述べるとすれば「クオリティ優先なら東京反訳、納期優先ならコエラボ」ということになるが、いついかなる場合においてもこの法則が正しいかと言うとノーだろう。今回の音源データの分野に担当者がたまたま強かっただけという見方もできるし、次回も同じ担当者に当たるかどうかは分からない。そもそも、今回のテストではどこまでが属人的なのか判断するのは難しいからだ。「素起こし」ではなく「ケバ取り」を指定すれば結果が変わっていた可能性もある。今回の依頼が3月の繁忙期だったことも、影響を及ぼしているかもしれない。

 ではどうすればいいか、ということで、今回得られた結果をもとに、限りなく普遍的だと思われる「テープ起こしをアウトソースする際の注意点」を以下にまとめた。筆者も場数を踏んでいるわけではないのであくまで参考程度ということになるが、実際にテープ起こしを依頼する際、ざっと目を通してお役に立てていただければ幸いだ。

<発注時に「用語集」を渡す> テープ起こしの担当者は、決してその筋の専門家というわけではない。そのため、音源データの会話にたびたび登場する専門用語や固有名詞については、あらかじめ読み方を添えた用語集を渡しておくとよい。特に日本語では、前後の文脈を見ながら単語の意味を判断することも少なくないので、なるべく初期段階で正しい用語を知らせておいたほうが前後の文章を含めて精度が向上する。大仰なものではなくメモ程度の内容で十分だ。

<ケバ取りのレベルは明確に指定する> 今回の反省点の一つであるが、本当の意味での「素起こし」はかなり読みにくく、一読しただけでは意味が把握しづらいことから、納品後に音源データを聞き返す手間が発生しかねない。料金面で差がなければ「ケバ取り」を指定しておいたほうが、手戻りが少なくなると思われる。

<長時間のテキストにタイムコードは必須> テキスト内に、例えば15分区切りで「00:15:00」「00:30:00」といった具合にタイムコードが入力してあると、不明瞭な個所の頭出しを行う際に重宝する。今回依頼した中では、東京反訳がこのタイムコードの入力に対応していた。あまり短い区切りだとかえって邪魔になるので、10?30分程度の幅でタイムコードの入力を依頼するとよいだろう。逆に、1時間を超える音源データにもかかわらずタイムコードを入れられないという場合、発注を考え直したほうがよいと思われる。

<音源データはMP3で> 音源データをネット経由で送ることを考えると、データ容量がなるべく小さいMP3を選択するのがベターだ。「宅ふぁいる便」などファイル転送サービスを使う場合も容量制限に引っかかりにくいし、自社サーバなどにアップロードする場合でも容量が小さいほど送受信がスムーズになる。もちろん録音の品質が一定レベル以上であることが大前提だ。

<音源データ内の対象個所をきちんと伝えてコストを削減> 例えば1時間のインタビューの場合、自己紹介や世間話に終始した前半10分はテープに起こす必要がないという場合もあるはず。こうした場合は、事前に対象個所を指定しておくと、そのぶん料金が節約できる。具体的には、「0:10:01?0:59:59までが対象」といった具合に伝えておけば、冒頭10分の代金が不要になるというわけだ。たとえ無音であっても先方にチェックを任せると費用が発生しかねないので、事前にチェックしてから音源データを渡すとよいだろう。

<支払い方法もチェックしておく> BtoBでの発注であればたいていの業者が後払いに対応するようだが、例外もあるかもしれないので注意したい。筆者のようなフリーランスからの依頼の場合、今回のコエラボのように初回に限って前入金を求められる場合もある。発注前に念のためにチェックをするとよいだろう。【山口真弘】

【関連記事】
? 「テープ起こし」に特化した再生ソフト
? 新人記者は「ビジネス用ICレコーダー」をこう選ぶ
? 電話で録音、メールで受信――声をテキスト化する「コエレン」
? 「完璧主義」を止めよう

引用元:市川市歯科の総合情報サイト

0 件のコメント:

コメントを投稿