Kazuhiro Nakadai 研究室
主宰者:Kazuhiro Nakadai
東京工業大学
AI 要約(直近 5 年の研究成果)
本研究室は、ロボットやドローンが周囲の音環境を理解・認識する「ロボット聴覚」に関する研究を展開しています。マイクロフォンアレイ(複数のマイクを配置したセンサー)を用いて、音源の位置を特定したり、混在する複数の音声から目的の音を抽出したり、騒音環境での音声認識精度を向上させたりするための手法を開発しています。これらの技術は、信号処理とニューラルネットワークの両面からアプローチされており、実環境の変化に適応できるシステム設計が重視されています。
具体的には、災害救助現場での要救助者の発見を想定した複数ドローンによる音源探索システムや、画像が得られない煙や崩落した建物内での聴覚情報の活用など、視覚情報が限定される状況での応用を進めています。また、聴覚障害者向けの手話表現システムや、森林生態系における動物の鳴き声分析など、ロボット聴覚技術の社会的応用も広がっています。さらに、エッジコンピューティングデバイスやFPGAへの実装による高速化・低消費電力化、複数のセンサー間の自動キャリブレーション技術も並行して開発されており、現実世界での実装可能性を高める取り組みが特徴です。
※ AI(Claude)が、公開されている論文要旨から研究の問い・手法・主要な発見を事実情報として抽出・再構成して自動生成しています。誤りを含む可能性があるため、正確性は研究室公式情報でご確認ください。
外部リンク
関連研究室(8 件)
- 農学・生物科学Takanori Fukao 研究室東京大学論文 31 件·共通: ロボット, 工学, 機械・ロボティクス, ロボティクス +8
- エネルギーKenichi Furuhashi 研究室東京大学論文 21 件·共通: ロボット, 工学, 機械・ロボティクス, ロボティクス +8
- 環境科学Alexandros Gasparatos 研究室東京大学論文 58 件·共通: システム, 情報工学, 計算機科学, 地球科学・環境 +7
- 環境科学Keigo Noda 研究室東京大学論文 36 件·共通: 生態, 生物学, 生態・進化, 生態学 +6
- 農学・生物科学Ko Mochizuki 研究室東京大学論文 22 件·共通: 生物学, 生態・進化, 生態, 生態学 +6
- 農学・生物科学Kazuhiro Fujiwara 研究室東京大学論文 21 件·共通: 生物学, システム, 情報工学, 計算機科学 +6
- 環境科学Tsutom Hiura 研究室東京大学論文 35 件·共通: 生態, 生物学, 生態・進化, 生態学 +5
- 環境科学Tomohiko Kawamura 研究室東京大学論文 31 件·共通: 環境, 地球科学・環境, 環境科学, 環境保全 +5
研究成果(73 件)
- DOI: https://doi.org/10.23919/eusipco63237.2025.11226413
- DOI: https://doi.org/10.1109/ro-man63969.2025.11217908
- DOI: https://doi.org/10.1109/jsen.2025.3580427
- DOI: https://doi.org/10.7210/jrsj.43.537
- DOI: https://doi.org/10.1109/apsipaasc65261.2025.11249079
- DOI: https://doi.org/10.1109/iros60139.2025.11247372
- DOI: https://doi.org/10.1145/3716553.3750765
- [2024] HARK3.6およびそのアクティブドローン聴覚への応用
- DOI: https://doi.org/10.1080/01691864.2024.2410825
続きを表示(残り 63 件)閉じる
- DOI: https://doi.org/10.23919/eusipco63174.2024.10715427
- DOI: https://doi.org/10.1080/01691864.2024.2379384
- [2024] A Performance Assessment on Rotor Noise-Informed Active Multidrone Sound Source Tracking MethodsDOI: https://doi.org/10.3390/drones8060266
- DOI: https://doi.org/10.1109/coolchips61292.2024.10531180
- DOI: https://doi.org/10.1109/sii58957.2024.10417224
- DOI: https://doi.org/10.1109/tro.2024.3410456
- [2024] Improving Noise Robustness of Automatic Speech Recognition with Speech Enhancement and AdaptersDOI: https://doi.org/10.7210/jrsj.42.920
- DOI: https://doi.org/10.7210/jrsj.42.584
- DOI: https://doi.org/10.1186/s13636-024-00387-x
- DOI: https://doi.org/10.3390/chips4010002
- DOI: https://doi.org/10.1109/apsipaasc63619.2025.10848937
- DOI: https://doi.org/10.1109/apsipaasc63619.2025.10849321
- DOI: https://doi.org/10.1109/apsipaasc63619.2025.10848984
- DOI: https://doi.org/10.1080/01691864.2024.2440161
- DOI: https://doi.org/10.21437/interspeech.2023-1162
- DOI: https://doi.org/10.1109/ro-man57019.2023.10309531
- DOI: https://doi.org/10.21437/interspeech.2023-1320
- DOI: https://doi.org/10.35995/jea7010002
- [2023] Performance evaluation of sound source localisation and tracking methods using multiple dronesDOI: https://doi.org/10.3397/in_2023_0291
- DOI: https://doi.org/10.1109/apsipaasc58517.2023.10317440
- DOI: https://doi.org/10.1109/mlsp55844.2023.10285999
- DOI: https://doi.org/10.1109/ro-man57019.2023.10309550
- DOI: https://doi.org/10.3390/drones7070405
- DOI: https://doi.org/10.1109/coolchips57690.2023.10121954
- DOI: https://doi.org/10.1002/ece3.9938
- DOI: https://doi.org/10.3390/app13063607
- DOI: https://doi.org/10.1109/sii55687.2023.10039204
- DOI: https://doi.org/10.1109/sii55687.2023.10039440
- [2023] Metric-Based Multimodal Meta-Learning for Human Movement Identification Via Footstep RecognitionDOI: https://doi.org/10.1109/sii55687.2023.10039089
- DOI: https://doi.org/10.1109/sii55687.2023.10039271
- DOI: https://doi.org/10.1109/sii55687.2023.10039167
- DOI: https://doi.org/10.1109/sii55687.2023.10039198
- [2022] 複数音源追跡におけるドローン群の行動計画の検討
- DOI: https://doi.org/10.21437/interspeech.2022-11077
- DOI: https://doi.org/10.21437/interspeech.2022-11216
- DOI: https://doi.org/10.21437/interspeech.2022-576
- DOI: https://doi.org/10.3389/frobt.2022.854572
- DOI: https://doi.org/10.3390/app12042195
- DOI: https://doi.org/10.7210/jrsj.40.351
- [2022] Evaluation of a Speech Enhancement Method Combining Ensemble Time-Frequency Masking and BeamformingDOI: https://doi.org/10.7210/jrsj.40.631
- DOI: https://doi.org/10.1109/candarw57323.2022.00057
- [2022] 低解像度画像からの小領域物体の検出手法の検討
- DOI: https://doi.org/10.1109/ieeeconf49454.2021.9382665
- DOI: https://doi.org/10.1109/ieeeconf49454.2021.9382648
- DOI: https://doi.org/10.1109/ieeeconf49454.2021.9382639
- [2021] Proposal and Evaluation of Spatial Sound Source Separationusing NMF with Multiple Microphone ArraysDOI: https://doi.org/10.7210/jrsj.39.669
- DOI: https://doi.org/10.7210/jrsj.39.271
- [2021] Sound Source Tracking Using Integrated Direction Likelihood for Drones with Microphone ArraysDOI: https://doi.org/10.1109/ieeeconf49454.2021.9382619
- DOI: https://doi.org/10.1109/ieeecloudsummit52029.2021.00018
- DOI: https://doi.org/10.1109/iros51168.2021.9636631
- [2021] Assessment of Sound Source Tracking Using Multiple Drones Equipped with Multiple Microphone ArraysDOI: https://doi.org/10.3390/ijerph18179039
- DOI: https://doi.org/10.21437/interspeech.2021-1050
- DOI: https://doi.org/10.1109/icas49788.2021.9551166
- DOI: https://doi.org/10.3390/birds2020012
- DOI: https://doi.org/10.1007/s10489-021-02285-7
- DOI: https://doi.org/10.1007/s10489-021-02314-5
- DOI: https://doi.org/10.1109/slt48900.2021.9383593
- [2021] EMC: Earthquake Magnitudes Classification on Seismic Signals via Convolutional Recurrent NetworksDOI: https://doi.org/10.1109/ieeeconf49454.2021.9382696
- DOI: https://doi.org/10.1109/ieeeconf49454.2021.9382730
科研費(0 件)
まだデータがありません(KAKEN 取り込み後に表示)。
所属学会・役職(0 件)
まだデータがありません(学会データ連携後に表示)。