名古屋工業大学大学院工学研究科情報工学プログラム助教

sei.ueno[at]nitech.ac.jp

上乃聖, 稲熊寛文, 三村正人, 河原達也. 「文字単位のモデルを併用した単語単位のEnd-to-End音声認識」日本音響学会研究発表会講演論文集, 3-8-5, 春季2018, 学生優秀賞受賞.
上乃聖, 森谷崇史, 三村正人, 坂井信輔, 篠原雄介, 山口義和, 青野裕司, 河原達也. 「転移学習による注意機構付き単語単位音声認識の適応」電子情報通信学会技術研究報告, SP2018-23, 2018, 学生ポスター賞受賞.
上乃聖, 三村正人, 坂井信輔, 河原達也. 「End-to-End音声合成を用いた単語単位End-to-End音声認識のデータ拡張」情報処理学会研究報告, SLP-125-2, 2018, 学生論文賞受賞.

Sei Ueno, Hirofumi Inaguma, Masato Mimura, Tatsuya Kawahara: Acoustic-to-word Attention-based Model Complemented with Character-level CTC-based Model.International Conference on Acoustics, Speech, and SignalProcessing (ICASSP), pp.5804-5808, 2018.
Sei Ueno, Takafumi Moriya, Mimura Mimura, Shinsuke Sakai, YoshikazuYamaguchi, Yushi Aono, Tatsuya Kawahara: Encoder Transfer for Attention-based Acoustic-to-word Speech Recognition. INTERSPEECH, pp.2424-2428, 2018.
Sei Ueno, Masato Mimura, Shinsuke Sakai, Tatsuya Kawahara: Multi-speaker Sequence-to-sequence Speech Synthesis for Data Augmentation in Acoustic-to-word Speech Recognition.International Conference on Acoustics, Speech, and Signal Processing (ICASSP), accepted, 2019.

Han Feng, Sei Ueno, Tatsuya Kawahara : End-to-End Speech Emotion Recognition Combined with Acoustic-to-Word ASR Model. INTERSPEECH, pp.501–-505, 2020.
Hayato Futami, Hirofumi Inaguma, Sei Ueno, Masato Mimura, Shinsuke Sakai, Tatsuya Kawahara: Distilling the Knowledge of BERT for Sequence-to-Sequence ASR. INTERSPEECH, pp.3635–3639, 2020.
Viet-Trung Dang, Tianyu Zhao,Sei Ueno, Hirofumi Inaguma, Tatsuya Kawahara: End-to-End Speech-to-Dialog-Act Recognition. INTERSPEECH, pp.3910–3914, 2020.
Kohei Matsuura, Sei Ueno, Masato Mimura, Shinsuke Sakai, Tatsuya Kawahara: Speech Corpus of Ainu Folklore and End-to-end Speech Recognition for Ainu Language. International Conference on Language Resources and Evaluation (LREC), pp.2622-2628,2020.
Takafumi Moriya, Sei Ueno, Yusuke Shinohara, Marc Delcroix, YoshikazuYamaguchi, Yushi Aono: Multi-task Learning with Augmentation Strategy for Acoustic-to-word Attention-based Encoder-decoder Speech Recog-nition.INTERSPEECH, pp.2399-2403, 2018.
Masato Mimura, Sei Ueno, Hirofumi Inaguma, Shinsuke Sakai, and Tatsuya Kawahara: Leveraging sequence-to-sequence Speech Synthesis for En-hancing Acoustic-to-word Speech Recognition.Workshop On Spoken Lan-guage Technology (SLT), pp.477-484, 2018.