次世代対話システムの基盤技術　～人が信頼できるAIとしての対話システム開発～ (Fundamental technology for next-generation dialogue systems – Development of dialogue systems as AI that people can trust)

教授　駒谷和範（産業科学研究所） KOMATANI Kazunori(SANKEN (The Institute of Scientific and Industrial Research))

研究の概要

近年、スマートフォン上の応答アプリや対話ロボットなど、人と機械が音声言語を使ってインタラクションを行う機会が増えています。しかし、現状の音声インタラクションは言語内容に偏重しており、人間が無意識のうちに伝えている気持ちなどを機械は読み取れていません。また現状で機械が話せるのは事前に準備された内容のみであるため、機械が対話を通じて自ら賢くなる技術にも期待が高まっています。

そこで、まず映像や声の韻律などのマルチモーダル情報をもとに、ユーザの言外の情報を読み取って話す音声対話システムを研究しています（図1）。また対話を通じて知識を獲得できるシステムを目指して、知らない単語に関する推定結果が正しいかどうかを、対話の流れから判断する暗黙的確認という手法も提案しています（図2）。

研究の先に見据えるビジョン

「あなた」に合わせて話せる人工知能

人工知能、特に様々な人と話をする対話システムでは、大量一括生産型ではなく、個々の家庭や人間に適応できる能力が重要になります。人や社会から信頼される対話システムはきっと、あなたの様子に応じて話してくれて、またあなたが言ったことも覚えてくれているでしょう。このような技術の応用として、例えば聞き役サービスロボットが考えられます。高齢化社会を迎える我が国において、話すことによりお年寄りの認知機能の低下抑制が見込まれます。また、会話を弾ませることができるシステムは、語学学習分野への応用も考えられます。人の「話したい」「聞いてほしい」という欲求を満たせる技術の実現により、メンタルヘルス分野への応用も考えられます。

担当研究者

教授　駒谷和範（産業科学研究所）

※本学ResOUのホームページ「究みのStoryZ」に、インタビュー記事が掲載されています。是非ご覧ください。
https://resou.osaka-u.ac.jp/ja/story/2017/g006883/
https://resou.osaka-u.ac.jp/ja/story/2017/g006882/

キーワード

音声対話システム／マルチモーダル対話／ユーザ適応／自然言語処理

応用分野

相手の様子に応じて話す対話ロボット／話すにつれて賢くなる対話システム

※本内容は大阪大学経営企画オフィス制作「大阪大学若手研究者の取組・ビジョン2020」より抜粋したものです。