FrontPage - ongacrest/podcastle GitHub Wiki

PodCastleとは

PodCastle - Podcastelとは - 使い方 - コンテンツの登録・削除方法 - クレジット - 開発履歴 - 学術情報

PodCastle(ポッドキャッスル)は、インターネット上で公開されている、 動画共有サービス(ニコニコ動画、YouTube、Ustream)の動画中の発言内容や、 ポッドキャスト(音声版ブログ)の音声中の発言内容を検索できるサービスです。 PodCastleのトップページ から好きな言葉を入力すると、 その言葉に関するシーンを検索して閲覧できます。

音声認識技術で、音声を文字に

PodCastleは、音声認識という技術を使い、音声を文字(テキスト)の索引に変換しています。 つまり、コンピュータが動画音声データ (動画共有サービスやポッドキャストによって公開されているコンテンツ)中の音声を解析・認識し、 文字として書き起こします。 そして、その文字列を索引として全文検索を行い、検索結果を表示します。 産業技術総合研究所(AIST)が開発した日本語音声認識システムを用いることによって、 高精度の認識性能を実現しています。

認識結果をみんなで訂正する

日本語には、同音異義語が多数あります。 また、残響や雑音が大きく聞きとりにくい音声は、人 間が聞いても間違えてしまうことがあります。 そのような音声は、コンピュータにもうまく認識できません。 また、音声認識技術はまだまだ研究段階なので、 人間には容易に聞き分けられる音声でも間違えてしまうことがあります。 つまり、音声認識では認識誤りを避けることができないのです。

そこでPodCastleでは、音声認識の持つ最大の欠点である認識誤りを、 みんなで訂正するという方法で克服する世界初の仕組みを実現しました。 検索された動画音声データは、簡単な操作で認識誤りを訂正することができます。 訂正した結果を「保存」ボタンを押して共有することによって、 索引が正しくなり、 徐々に正しい認識結果を検索することができるようになっていきます。

さらに、他の人と分担しながら協力し合って書き起こしたり、 話者名や改行を入力しながら、読みやすく書き起こしたりすることもできます。

成長する検索エンジン

PodCastleは、成長する検索エンジンです。 みなさんが認識誤りを訂正すると、単に認識結果が修正されるだけではなく、 音声認識システム自体が、どのような音声が間違えやすいか、 何が正解だったのかを知り、学習して成長していくのです。 その結果、これまでよりももっと音声認識の精度が上がっていきます。

つまり、認識誤りを訂正することによって、 みんなで音声認識システムを育てていることにもなるのです。

より詳しく知りたい方へ

日本語のポッドキャストに対象を限定した音声全文検索サービスを一般公開(2008/06/12)

動画共有サービスに対応した音声全文検索・書き起こしサービス(日本語版および英語版)を一般公開(2011/10/12)

PodCastle Wiki

PodCastleのWikiです。情報交換の場としてお使い下さい。

  • PodCastle Wiki PodCastleのよくある質問や、意見交換などは、Wikiをご覧下さい。

History

  • 2006-12-01: ベータ版の試験公開開始(世界初の日本語ポッドキャスト全文検索サービス)
  • 2006-12-07: WISS2006論文発表
  • 2006-12-08: WISS2006 で ベストペーパー賞受賞
  • 2007-02-09: 音声言語情報処理研究会論文発表1論文発表2
  • 2007-08-30: Interspeech 2007 で [論文発表1|http://staff.aist.go.jp/m.goto/PAPER/INTERSPEECH2007goto.pdf]、[論文発表2|http://staff.aist.go.jp/m.goto/PAPER/INTERSPEECH2007ogata.pdf]
  • 2007-09-19: 日本音響学会研究発表会招待講演
  • 2008-06-12: 日本語のポッドキャストを対象とした音声全文検索サービスPodCastleの一般公開による実証実験開始(産総研プレスリリース
  • 2008-06-17: 先端的データベースとWeb技術動向講演会(ACM SIGMOD日本支部大会) で 招待講演
  • 2008-12-02: WebDB Forum 2008招待講演
  • 2009-10-23: SSCS 2009 でデモンストレーション
  • 2010-05-28: KJDB 2010 で招待講演
  • 2010-09-16: Webインテリジェンスとインタラクション研究会 で招待講演
  • 2010-11-05: PACLIC 24 で招待講演
  • 2011-10-12: 動画共有サービスに対応した音声全文検索・書き起こしサービス(日本語版および英語版)PodCastleの一般公開による実証実験開始(産総研プレスリリース
  • History {{right {{counter}} }}
⚠️ **GitHub.com Fallback** ⚠️