SEMリサーチ

SEMリサーチ

産総研、ポッドキャストの全文検索サービス「PodCastle」一般公開

独立行政法人産業技術総合研究所(産総研)は2008年6月12日、キーワードによるポッドキャスト全文検索サービス「PodCastle(ポッドキャッスル)」を一般公開した。

PodCastleは収集したポッドキャスト(音声データ)を、音声認識技術でテキストに変換してインデックスを作成することにより、音声全てを検索対象にしたサービス。検索キーワードを含むポッドキャストを検索結果に表示できるうえ、検索結果乗にはキーワード周辺の音声認識結果が表示され文脈を確認することができる。また、オリジナルのサイトから音声を聴いて確認することも可能。

さらに、PodCastleは従来の音声認識では対応できない、新語や時事用語、芸能人名といった新しい言葉に対応する新しい技術を採用。ネット上のニュース記事や辞書などから自動的に新しい言葉を追加し、また、その前後の文脈(つながり)も学習するため、音声認識の精度を高めることに成功した。たとえば、サブプライムローンやiPS細胞、taspoなどの新しい言葉でもPodCastleでは早期に自動認識ができたほか、「アメリカのサブプライムローン問題」のようなつながりも自動学習したという。

PodCastleは音声認識技術により全文検索サービスを実現しているが、音声が必ずしも100%正しく認識できるわけではない。そこでPodCastleは不特定多数のユーザーが簡単な操作で誤認識を訂正できる新たなインターフェースを開発した。PodCastleは音声認識結果時に可能性の高かった他の認識候補もあらかじめ保存しており、ユーザーは誤認識に気がついた時に正しい候補を選択するだけで訂正することができる。多数のユーザーによる訂正結果を学習することで、音声の検索・認識性能が向上していくという。

産業技術総合研究所は今後、PodCastleを産業界と連携して実用化し、ウェブサービスや、ロボット、コールセンター、会議議事録作成等の様々な応用に展開していく予定。

PodCastle

http://podcastle.jp/

ユーザーが協力すると性能が向上する音声情報検索システムを実現 -インターネット上の音声情報を認識・検索するサービスを開始-

http://www.aist.go.jp/aist_j/press_release/pr2008/pr20080612/pr20080612.html

COPYRIGHT © 1997-2020 渡辺隆広(わたなべ たかひろ) ALL RIGHTS RESERVED.

SEMリサーチ(www.sem-r.com)に掲載している文章及び図版の無断使用及び転載を禁じます。著作権侵害行為には厳正に対処します。

免責事項:SEMリサーチは、本記事中で触れている企業、商品、サービスの全て(情報)について、有用性、適合性、正確性、安全性、最新性、真実性に関する一切の保証をしておりません。各自の判断でご利用下さい。