Kohei Yatabe 研究室
主宰者:Kohei Yatabe
東京農工大学
AI 要約(直近 5 年の研究成果)
音声・音響信号処理における様々な逆問題を、最適化手法を用いて解く研究に取り組んでいます。具体的には、複数の音声混合から各音源を分離する問題、音声に残存する残響を除去する問題、破損した音声区間の復元といった、実環境での音響処理に必要な課題に着目しています。これらの課題に対して、時間周波数領域での信号表現や凸最適化、特に交互方向乗数法(ADMM)などの高速な最適化アルゴリズムを活用して、効率的な解法を開発しています。
深層神経網(DNN)を音響信号処理に統合する研究も展開しており、従来のモデルベースの手法とDNNの学習能力を組み合わせることで、両者の長所を活かした手法の構築を目指しています。また、異なるサンプリング周波数で訓練された音響処理モデルの性能を維持するための技術開発にも取り組んでおり、実用的な信号処理システムの構築に向けて研究を進めています。
さらに、音響計測の一般的な枠組みを提案し、通常の試験信号だけでなく音楽を含む任意の音を計測に用いる手法を開発しています。これらのツールは公開されており、研究者や教育の現場での広範な活用を想定した、実践的で応用性の高い研究を特徴としています。
※ AI(Claude)が、公開されている論文要旨から研究の問い・手法・主要な発見を事実情報として抽出・再構成して自動生成しています。誤りを含む可能性があるため、正確性は研究室公式情報でご確認ください。
外部リンク
関連研究室(8 件)
- 計算機科学Hiroshi Saruwatari 研究室東京大学論文 187 件·共通: 信号処理, 通信, 電気・電子, 学習 +8
- 社会科学Masatoshi Okutomi 研究室東京工業大学論文 100 件·共通: 理論計算機科学, アルゴリズム, 最適化, 学習 +8
- 工学Kensuke Harada 研究室大阪大学論文 100 件·共通: 理論計算機科学, アルゴリズム, 学習, 計算機科学 +7
- 工学Atsushi Yamashita 研究室東京大学論文 184 件·共通: 信号処理, 通信, 電気・電子, 計算機科学 +3
- 物理学・天文学Akira Hirose 研究室東京大学論文 164 件·共通: 信号処理, 通信, アルゴリズム, 電気・電子 +2
- 工学Ryo Natsuaki 研究室東京大学論文 181 件·共通: 通信, 電気・電子, 学習, 計算機科学 +6
- 計算機科学Hajime Asama 研究室東京大学論文 183 件·共通: 信号処理, 学習, 計算機科学, システム +6
- 計算機科学Jun Ota 研究室東京大学論文 149 件·共通: 応用数学, 応用・計算数学, 最適化, 計算機科学 +7
研究成果(73 件)
- [2026] Encoder-masking-decoder networks using orthogonal convolutional layer as invertible linear encoderDOI: https://doi.org/10.1250/ast.e26.10
- DOI: https://doi.org/10.1109/sampta64769.2025.11133562
- DOI: https://doi.org/10.1016/j.sigpro.2025.110420
- DOI: https://doi.org/10.1250/ast.e25.46
- DOI: https://doi.org/10.1109/gcce65946.2025.11275437
- DOI: https://doi.org/10.1250/ast.e25.14
- DOI: https://doi.org/10.1109/sampta64769.2025.11133538
- DOI: https://doi.org/10.1250/ast.e24.95
- DOI: https://doi.org/10.1250/ast.e25.04
- DOI: https://doi.org/10.23919/eusipco63237.2025.11226337
続きを表示(残り 63 件)閉じる
- DOI: https://doi.org/10.1250/ast.e24.119
- DOI: https://doi.org/10.1250/ast.e25.07
- DOI: https://doi.org/10.1364/ol.530258
- DOI: https://doi.org/10.1107/s1600576724006897
- DOI: https://doi.org/10.1109/o-cocosda64382.2024.10800149
- DOI: https://doi.org/10.1561/116.20230082
- DOI: https://doi.org/10.1107/s1600576724004709
- DOI: https://doi.org/10.1109/icassp48485.2024.10448266
- DOI: https://doi.org/10.1109/lsp.2024.3459811
- DOI: https://doi.org/10.1109/icassp48485.2024.10446726
- DOI: https://doi.org/10.1250/ast.e23.40
- DOI: https://doi.org/10.1109/taslp.2024.3463415
- [2023] HIGH-SPEED OPTICAL IMAGING AND SPATIO-TEMPORAL ANALYSIS OF SOUND SOURCES OF EDGE TONE PHENOMENADOI: https://doi.org/10.25144/14930
- DOI: https://doi.org/10.1250/ast.e23.67
- DOI: https://doi.org/10.3397/in_2023_0894
- DOI: https://doi.org/10.1109/apsipaasc58517.2023.10317411
- DOI: https://doi.org/10.1109/apsipaasc58517.2023.10317156
- DOI: https://doi.org/10.1109/gcce59613.2023.10315633
- DOI: https://doi.org/10.1121/10.0023432
- DOI: https://doi.org/10.1109/waspaa58266.2023.10248089
- DOI: https://doi.org/10.23919/eusipco58844.2023.10289819
- DOI: https://doi.org/10.23919/eusipco58844.2023.10289838
- [2023] Computationally efficient transparent sound source for the finite-difference time-domain methodDOI: https://doi.org/10.1250/ast.44.371
- DOI: https://doi.org/10.21437/interspeech.2023-1584
- [2023] Synthesizing Speech from ECoG with a Combination of Transformer-Based Encoder and Neural VocoderDOI: https://doi.org/10.1109/icassp49357.2023.10097004
- DOI: https://doi.org/10.1109/icassp49357.2023.10095348
- DOI: https://doi.org/10.1109/icassp49357.2023.10095928
- DOI: https://doi.org/10.1121/10.0017246
- DOI: https://doi.org/10.3397/in_2022_0525
- [2023] High-speed optical imaging and spatio-temporal analysis of sound sources of edge tone phenomenaDOI: https://doi.org/10.3397/in_2022_0613
- DOI: https://doi.org/10.1109/slt54892.2023.10022496
- DOI: https://doi.org/10.1109/lsp.2023.3303699
- DOI: https://doi.org/10.1250/ast.43.209
- DOI: https://doi.org/10.1364/ol.469972
- DOI: https://doi.org/10.21437/interspeech.2022-800
- [2022] On-line sound event localization and detection for real-time recognition of surrounding environmentDOI: https://doi.org/10.1016/j.apacoust.2022.108961
- DOI: https://doi.org/10.1016/j.apacoust.2022.108988
- DOI: https://doi.org/10.1107/s1600576722005234
- DOI: https://doi.org/10.1250/ast.43.177
- [2022] Harmonic and Percussive Sound Separation Based on Mixed Partial Derivative of Phase SpectrogramDOI: https://doi.org/10.1109/icassp43922.2022.9747057
- DOI: https://doi.org/10.1109/icassp43922.2022.9747089
- DOI: https://doi.org/10.1109/icassp43922.2022.9747423
- [2022] SpecGrad: Diffusion Probabilistic Model based Neural Vocoder with Adaptive Noise Spectral ShapingDOI: https://doi.org/10.21437/interspeech.2022-301
- DOI: https://doi.org/10.1109/access.2022.3161543
- [2022] Sampling-Frequency-Independent Convolutional Layer and its Application to Audio Source SeparationDOI: https://doi.org/10.1109/taslp.2022.3203907
- DOI: https://doi.org/10.1109/taslp.2022.3221041
- DOI: https://doi.org/10.1109/icassp43922.2022.9746544
- DOI: https://doi.org/10.1250/ast.43.339
- DOI: https://doi.org/10.25144/14194
- DOI: https://doi.org/10.1250/ast.42.261
- DOI: https://doi.org/10.21437/interspeech.2021-2073
- [2021] Noisy-target Training: A Training Strategy for DNN-based Speech Enhancement without Clean SpeechDOI: https://doi.org/10.23919/eusipco54536.2021.9616166
- DOI: https://doi.org/10.23919/eusipco54536.2021.9615941
- DOI: https://doi.org/10.23919/eusipco54536.2021.9615982
- DOI: https://doi.org/10.23919/eusipco54536.2021.9616089
- DOI: https://doi.org/10.1109/icassp39728.2021.9413494
- DOI: https://doi.org/10.1109/icassp39728.2021.9414921
- [2021] Determined BSS Based on Time-Frequency Masking and Its Application to Harmonic Vector AnalysisDOI: https://doi.org/10.1109/taslp.2021.3073863
- DOI: https://doi.org/10.1109/taslp.2021.3095656
- DOI: https://doi.org/10.1587/essfr.15.1_25
- DOI: https://doi.org/10.1109/icassp39728.2021.9415057
科研費(0 件)
まだデータがありません(KAKEN 取り込み後に表示)。
所属学会・役職(0 件)
まだデータがありません(学会データ連携後に表示)。