機械学習を応用した音声情報処理技術　～ユーザに適応する音声対話システムの開発～ (Speech information processing based on machine learning – Development of a user-adaptive spoken dialogue system)

准教授　武田龍（産業科学研究所） TAKEDA Ryu(SANKEN (The Institute of Scientific and Industrial Research))

研究の概要

人間と機械・ロボットが共生する社会の中において、音声インタフェースはユーザに特殊な知識を必要としないコミュニケーション手段として重要だと考えます。

我々は、事前に学習していない環境やユーザ、音色や知らない言葉が出てきても、ロボットが自動的に適応や学習を行えるような技術の研究を進めています。音声信号処理から音声対話技術を含めたシステム全体をデザインすることで、各種課題の解決を図ります。具体的には、残響環境下での音声信号の分離（図1）、ベイズ推定に基づく単語分割と未登録単語の検出、深層学習を応用した音源定位の高精度化（図2）や深層学習に基づく音響モデルのオンライン適応、音声対話を通じたユーザへのモデル適応・知識獲得などの研究を行っています。

研究の先に見据えるビジョン

音声対話を学習するロボット・コンピュータの実現

音情報を自らの耳で聞き、人間と対話を行うことで、自律的に学習していくロボットやコンピュータの実現を目指します。家庭環境やユーザ個人に対してロボット自身が学習することで、より使いやすく役に立つシステムが実現できると期待します。

担当研究者

准教授　武田龍（産業科学研究所）

キーワード

統計的信号処理／音声情報処理／オンライン適応

応用分野

ロボット／ヒューマンマシンインタフェース／スマートデバイス

※本内容は大阪大学経営企画オフィス制作「大阪大学若手研究者の取組・ビジョン2020」より抜粋したものです。