FrontPage - ongacrest/podcastle GitHub Wiki
PodCastle(ポッドキャッスル)は、インターネット上で公開されている、 動画共有サービス(ニコニコ動画、YouTube、Ustream)の動画中の発言内容や、 ポッドキャスト(音声版ブログ)の音声中の発言内容を検索できるサービスです。 PodCastleのトップページ から好きな言葉を入力すると、 その言葉に関するシーンを検索して閲覧できます。
PodCastleは、音声認識という技術を使い、音声を文字(テキスト)の索引に変換しています。 つまり、コンピュータが動画音声データ (動画共有サービスやポッドキャストによって公開されているコンテンツ)中の音声を解析・認識し、 文字として書き起こします。 そして、その文字列を索引として全文検索を行い、検索結果を表示します。 産業技術総合研究所(AIST)が開発した日本語音声認識システムを用いることによって、 高精度の認識性能を実現しています。
日本語には、同音異義語が多数あります。 また、残響や雑音が大きく聞きとりにくい音声は、人 間が聞いても間違えてしまうことがあります。 そのような音声は、コンピュータにもうまく認識できません。 また、音声認識技術はまだまだ研究段階なので、 人間には容易に聞き分けられる音声でも間違えてしまうことがあります。 つまり、音声認識では認識誤りを避けることができないのです。
そこでPodCastleでは、音声認識の持つ最大の欠点である認識誤りを、 みんなで訂正するという方法で克服する世界初の仕組みを実現しました。 検索された動画音声データは、簡単な操作で認識誤りを訂正することができます。 訂正した結果を「保存」ボタンを押して共有することによって、 索引が正しくなり、 徐々に正しい認識結果を検索することができるようになっていきます。
さらに、他の人と分担しながら協力し合って書き起こしたり、 話者名や改行を入力しながら、読みやすく書き起こしたりすることもできます。
PodCastleは、成長する検索エンジンです。 みなさんが認識誤りを訂正すると、単に認識結果が修正されるだけではなく、 音声認識システム自体が、どのような音声が間違えやすいか、 何が正解だったのかを知り、学習して成長していくのです。 その結果、これまでよりももっと音声認識の精度が上がっていきます。
つまり、認識誤りを訂正することによって、 みんなで音声認識システムを育てていることにもなるのです。
日本語のポッドキャストに対象を限定した音声全文検索サービスを一般公開(2008/06/12)
-
産総研プレスリリース (2008/06/12)
-
産総研TODAY Vol.8, No.8 (2008/08/01)
-
AIST TODAY 2008 No.30 Autumn (2009/01/13)
-
マスメディア報道 -- 日本放送協会(NHK)「首都圏ネットワーク」2008年6月12日(木) 18:10~19:00 -- 日本放送協会(NHK)「いばらき わいわいスタジオ」2008年6月12日(木) 18:10~19:00 -- 日本経済新聞 2008年6月13日(金) 13面 -- 日経産業新聞 2008年6月13日(金) 3面 -- 日刊工業新聞 2008年6月13日(金) 26面 -- 毎日新聞 2008年6月13日(金) 27面 -- 読売新聞 2008年6月13日(金) 33面 -- 東京新聞 2008年6月13日(金) 3面 -- 茨城新聞 2008年6月13日(金) 21面 -- 常陽新聞 2008年6月23日(月) 3面 -- 日本情報産業新聞 2008年6月30日(月) 2面 -- 文部科学省 科学技術動向 2008年7月号 2008年7月26日(土) p.5 -- 文部科学省 科研費NEWSレター 2008年11月発行 Vol.2, 2008, p.8 -- 日経BP社 日経エレクトロニクス Tech-On!: 「みなさんで育ててください」,産総研がPodcast向け音声情報検索システムを開発 (2008/06/12) -- 毎日jp: 音声検索:音声データを文字変換・検索するシステム開発 (2008/06/12) -- YOMIURI ONLINE: ネット上の音声データを全文検索、国内初のサービス公開 (2008/06/12) -- インプレス INTERNET Watch: 日本語ポッドキャストの全文検索サービス、産総研が公開 (2008/06/13) -- RBB TODAY: 産総研、インターネット上の音声情報を認識・検索するサービスを開始~ユーザが協力で性能向上 (2008/06/13) -- ASCII.jp: ポッドキャストの音声データを検索できる! (2008/06/30)
動画共有サービスに対応した音声全文検索・書き起こしサービス(日本語版および英語版)を一般公開(2011/10/12)
-
[産総研プレスリリース|http://www.aist.go.jp/aist_j/press_release/pr2011/pr20111012/pr20111012.html]
-
マスメディア報道 -- 日刊工業新聞 2011年10月13日(木) 21面 -- 日刊スポーツ新聞 2011年10月13日(木) 18面 -- フジサンケイビジネス 2011年10月13日(木) 6面 -- 日本情報産業新聞 2011年10月24日(月) 2面 -- 産経新聞 2011年12月9日(金) 23面 -- I/O 平成24年1月号(2012年1月1日発行)「コンピュータの未来技術[第69回] PodCastle」, Vol.37, No.1, pp.84-86 -- インプレス INTERNET Watch: ニコ動やYouTubeの音声をテキスト化する「PodCastle」、産総研が公開 (2011/10/12) --- Yahoo!ニュース -- 日本経済新聞 NIKKEI NET: 産総研、音声全文検索・書き起こしサービス「PodCastle」を一般公開し実証実験を開始 (2011/10/12) -- @niftyニュース: 好みの語句でネット動画を検索 (2011/10/12) -- サーチナニュース: 音声認識システム公開、好みの語句でネット動画を検索 (2011/10/12) -- 沖縄タイムス: 登場人物の発言で動画を検索 (2011/10/12) -- 共同通信 47NEWS: 好みの語句でネット動画を検索 音声認識システム公開 (2011/10/13) --- 徳島新聞, 北海道新聞, 四国新聞, 山陰中央新報, 神戸新聞, 山梨日日新聞, 中日新聞, 福井新聞, 長崎新聞, 東京新聞, 秋田魁新報, 宮崎日日新聞, 河北新報 -- サンケイビズ: 産総研、音声で動画を検索 (2011/10/13) -- デイリースポーツ: 好みの語句でネット動画を検索 (2011/10/13) -- マイコミジャーナル: 産総研、ニコ動など動画音声データの検索・書き起こしシステムを公開 (2011/10/13) --- Yahoo!ニュース, gooニュース -- 情報管理Web 学術情報流通ニュース: 産総研、音声で動画を検索するシステムを公開、実証実験開始 (2011/10/13)
PodCastleのWikiです。情報交換の場としてお使い下さい。
- PodCastle Wiki PodCastleのよくある質問や、意見交換などは、Wikiをご覧下さい。
- 2006-12-01: ベータ版の試験公開開始(世界初の日本語ポッドキャスト全文検索サービス)
- 2006-12-07: WISS2006 で 論文発表
- 2006-12-08: WISS2006 で ベストペーパー賞受賞
- 2007-02-09: 音声言語情報処理研究会 で 論文発表1、論文発表2
- 2007-08-30: Interspeech 2007 で [論文発表1|http://staff.aist.go.jp/m.goto/PAPER/INTERSPEECH2007goto.pdf]、[論文発表2|http://staff.aist.go.jp/m.goto/PAPER/INTERSPEECH2007ogata.pdf]
- 2007-09-19: 日本音響学会研究発表会 で 招待講演
- 2008-06-12: 日本語のポッドキャストを対象とした音声全文検索サービスPodCastleの一般公開による実証実験開始(産総研プレスリリース)
- 2008-06-17: 先端的データベースとWeb技術動向講演会(ACM SIGMOD日本支部大会) で 招待講演
- 2008-12-02: WebDB Forum 2008 で 招待講演
- 2009-10-23: SSCS 2009 でデモンストレーション
- 2010-05-28: KJDB 2010 で招待講演
- 2010-09-16: Webインテリジェンスとインタラクション研究会 で招待講演
- 2010-11-05: PACLIC 24 で招待講演
- 2011-10-12: 動画共有サービスに対応した音声全文検索・書き起こしサービス(日本語版および英語版)PodCastleの一般公開による実証実験開始(産総研プレスリリース)
- History {{right {{counter}} }}