研究プロジェクト

人間の知の創造・伝達の多くは、音声によるコミュニケーションによって行われています。 本分野では、人間どうしがやりとりを行う音声メディアを分析し、自動認識・理解した上で、インタラクションを行えるシステムの実現をめざします。 具体的には、会議や講演のような自然な話し言葉音声をテキスト化するシステム、複数の話者や音源などからなる音環境や音楽を解析するシステム、非言語情報も統合しながら自然な対話が行える人間型ロボットなどの研究に取り組みます。

 

話し言葉の音声認識

  • 深層学習によるEnd-to-Endモデル...日本音響学会誌2018年7月号 (PDFファイル)
  • 大規模事前学習モデルに基づく音声認識...日本音響学会誌2023年9月号 (PDFファイル)
  • 音声認識による講演・講義の字幕付与...日本音響学会誌2018年3月号 (PDFファイル)

ロボットとの音声対話・インタラクション

  • アンドロイドによる音声対話研究 ..日本音響学会誌2020年4月号 (PDFファイル) , 日本音響学会誌2022年5月号 (PDFファイル)
  • 音声対話システムの進化と淘汰...人工知能学会研究会資料 SLUD-B203-02 (2013年) (PDFファイル)

音楽情報処理

  • 音楽と機械学習...情報処理学会誌2016年6月号 (PDFファイル)
  • 音楽と統計的記号処理...映像情報メディア学会誌2017年7月号 (PDFファイル)

音環境理解・統計的音響信号処理

  • 実環境下音声認識...情報処理学会研究報告, SLP-146-12 (2023年) (PDFファイル)
  • スマートポスターボード...人工知能学会研究会資料, Challenge-B303-1 (2014年) (PDFファイル)
  • 音楽音響信号解析のためのスパース学習...電子情報通信学会誌2016年5月号 (PDFファイル)

メディア処理技術を用いた語学学習支援(CALL)

  • 音声情報処理技術を用いた外国語学習支援...電子情報通信学会論文誌2013年7月号 (PDFファイル)