適用製品
発音辞書修正装置、およびそれを用いた音声認識装置、並びにそれらのコンピュータプログラム
目的
発音辞書のエントリーに対して、エントリー間の近さを考慮した生起確率を与えることのできる発音辞書修正装置、およびそのような発音辞書修正装置を用いた音声認識装置、並びにそれらのコンピュータプログラムを提供する。
効果
同一の表記で且つ近い発音のグループの頻度に基づいて、グループ生起確率を発音辞書データに付加することができる。これにより、個々の発音の頻度によって不当に低い生起確率が付加されるのを防ぐことができる。これにより、音声認識の精度が向上する。特に、大語彙連続音声認識における認識精度向上が可能となる。
同一の表記に対して発音ないしは発音のグループが多数存在するような場合でも、不当に低い生起確率となる可能性を回避することができる。
適応的に、最適なスムージング係数を決定することができ、更なる認識精度向上につながる。
技術概要
変形前発音および変形後発音のパターンデータを記憶する変化パターン定義記憶部と、発音辞書データから表記と発音のペアとしてなるエントリーを読み出すとともに、当該エントリーと、前記変化パターン定義記憶部から読み出した前記パターンデータを当該エントリーに含まれる発音に適用したときに得られる変化後発音を含み且つ当該エントリーと同一の表記を含む他のエントリーとを、同一のグループとしてグルーピングする発音グルーピング処理部と、学習データ中における表記の頻度と、前記学習データ中における前記グループごとの出現頻度であるグループ頻度とに基づき、前記表記に対する前記グループの生起確率をグループ生起確率として算出するグループ生起確率算出部と、発音辞書データから読み出した前記エントリーに、当該エントリーが属する前記グループについて算出された前記グループ生起確率を付加して、修正済発音辞書データとして出力する辞書修正処理部とを具備することを特徴とする発音辞書修正装置。