ハンズフリー音声翻訳端末

開放特許情報番号:L2019001965 開放特許情報登録日:2019/11/8 最新更新日:2023/1/16

基本情報
出願番号
公開番号
登録番号
出願日
2016/11/17
公開日
2018/5/24
出願人
富士通株式会社
特許権者
富士通株式会社
権利化状況
権利化済
発明の名称
音声処理方法、音声処理装置、及び音声処理プログラム
開放特許情報
技術分野
情報・通信
機能
制御・ソフトウェア 機械・部品の製造
適用製品
音声処理方法、音声処理装置、及び音声処理プログラム
目的
音声データにおける発話開始位置を正しく設定する。
効果
音声データにおける発話開始位置を正しく設定することが可能となる。
技術概要
コンピュータが、
複数のマイクロフォンにより同時に収音された複数の音声データから所定の条件に従って発話を検知したときに、前記所定の条件に基づいて、前記音声データにおける前記発話を検知した位置から過去に遡って前記発話の開始位置を設定し、
前記複数の音声データのそれぞれにおける前記発話の開始位置から前記発話を検知した位置までの特性差に基づいて、前記複数のマイクロフォンから見た発話者の方向を識別し、
識別した前記発話者の方向に基づいて、前記複数の音声データのいずれかにおける前記発話の開始位置以降の発話区間を抽出する、
処理を実行することを特徴とする音声処理方法。
イメージ図
実施実績   :
許諾実績 :
特許権譲渡  :
特許権実施許諾:
活用のヒント
登録者情報
登録者名称
その他の情報
関連特許
(国内):
(国外):
固定URLをクリップボードにコピーしました。
Copyright © INPIT Rights Reserved