
概要
自然で楽しく会話できるリアルタイム音声対話システムの研究開発

従来技術
・FAQ型やコマンド型の音声対話システムが主流で、会話は限定的かつ不自然。
・相槌や韻律制御が乏しく、ユーザ体験に物足りなさが残る。
優位性
・リアルタイムで応答生成。自然な会話が可能。
・VADレス認識など独自モデルで柔軟性を実現。
・プライバシー保護や安全性を考慮した設計。
特徴
本研究は、人とコンピュータが自然に楽しく会話できる音声対話システムの開発を目的としています。
従来のFAQ型・コマンド型から一歩進め、感情・文脈を考慮し、人に寄り添う対話を可能とすることで、
教育・医療・日常生活に新しい価値を提供します。
・DiaROS(ROS2ベースの対話システム):認識・合成・相槌・交替制御を統合したプラットフォーム。
・VADレス音声認識:発話区間検出不要で高精度かつリアルタイム処理に対応。
・韻律制御可能な音声合成:話し方や抑揚を自在に調整し、感情表現を可能にする。
・応答・相槌のタイミング制御:人間らしい会話の間合いを再現し、聞き心地を向上。
・相槌内容生成モデル:状況に応じた適切な相槌を自動選択し、会話を円滑化。
・ユーザ適応型対話:利用者の話し方や習熟度に応じて発話内容や応答スタイルを柔軟に調整。
・安全性・信頼性の確保:誤情報や不適切応答を抑止する仕組みを組み込み、安心して利用可能。
・オープンプラットフォーム化:研究者や企業が容易に拡張・検証できる開発基盤として公開を目指す。
実用化イメージ、想定される用途
・医療現場:高齢者や患者との会話支援、心理的安心感の提供。
・教育分野:子どもが楽しみながら学習できる音声教材や対話型教育支援。
・日常生活:家庭内アシスタントやロボットによる自然なコミュニケーション。
実用化に向けた課題
・多様な利用環境での認識精度と応答安定性の確保。
・利用者の個人差や会話スタイルへの適応。
・不適切な応答や誤情報を防ぐ安全性の検証。
研究者紹介
西村 良太 (にしむら りょうた)
豊橋技術科学大学 情報・知能工学系 准教授
researchmap
研究者からのメッセージ(企業等への提案)
音声対話は人に最も近いAI技術です。私たちは、安心感や学習意欲を支援できる対話システムを開発し、教育・医療など幅広い分野への実装を目指しています。共同研究や実証実験を通じて、実社会で役立つ技術を共に実現していきたいです。
知的財産等
掲載日:2025年09月10日
最終更新日:2025年09月11日