目的
背景音と音声が混合している入力信号の場合でも、適応的な話速変換を安定動作させることが可能な話速変換装置及びプログラムを提供する。
効果
入力信号の物理指標に基づき適応的な話速変換を行うため、従来技術では背景音と音声が混合している入力信号では“音声区間”と“無音区間"の判定が正確に行われない場合においても適応的な話速変換を行うことができ、即ち、背景音と音声が混合している入力信号に対しても、安定して、ゆっくり感を与える効果を高め、自然な聞こえとなる適応的話速変換が可能となる。
技術概要
入力信号の適応的話速変換を行う話速変換装置であって、
入力信号における単位時間あたりの自己相関で得られる相対的な最大値を表す有声度を物理指標として算出する有声度算出部と、
前記有声度の値が所定の閾値よりも大きい場合には話速を緩め、前記有声度の値が前記所定の閾値以下となる場合には話速を速めるように、入力信号の単位時間当たりの話速変換倍率を決定して話速変換を行う話速変換倍率決定部と、を備えることを特徴とする話速変換装置。