目的
映像および音声を蓄積するとともに、その発話内容を対象として映像および音声を検索することができ、検索結果として音声の該当箇所における話題や話者に関する情報などといった音声情報も利用者にわかりやすく提示することのできる、音声情報抽出装置を提供する。
効果
映像および音声を蓄積するとともに、その発話内容を対象として、検索語による映像および音声の検索をすることができ、検索結果として音声の該当箇所における話題や話者に関する情報などといった音声情報も利用者にわかりやすく提示することができる。
技術概要
音声情報抽出装置は、映像および音声を取得する映像音声収録部と、音響モデルと言語モデルとを用いて前記音声の音声認識処理を行なう音声認識部と、取得した映像および音声に関連するテキストデータを外部から取得するテキストデータ取得部と、取得したテキストデータと音声認識処理の結果とを比較することにより話題を抽出する話題抽出部と、音声認識結果と話題とを統合してなる音声情報を音声情報記憶部に書き込む音声情報統合部と、音声認識結果に基づき検索用インデックスを作成する検索用インデックス作成部と、検索語による検索要求に基づき検索用インデックス音声情報を検索し、該当する映像および音声に関連する音声情報を読み出して提示する検索サーバ部を具備する。