Tatsuya Harada 研究室

主宰者:Tatsuya Harada
東京大学
兼任:理化学研究所・RIKEN Center for Advanced Intelligence Project

AI 要約(直近 5 年の研究成果)

本研究室は、画像や動画などの視覚情報、および音声や言語を含むマルチモーダルデータの処理と理解を中心に研究を行っています。具体的には、コンピュータビジョンと自然言語処理の融合領域において、現実世界の多様な条件下でロバストな認識や生成を実現する手法の開発に取り組んでいます。カメラから取得した画像データの効率的な処理、異なるデータセット間での知識転移、複雑な視覚的構造の理解など、実務的な課題解決を指向した研究が特徴です。 視覚認識の側面では、未加工画像データの活用、異なる照明条件への対応、医療画像からの自動抽出など、実世界の課題に対応した手法を提案しています。また、限定的なアノテーション(人手による標付け)で学習できる手法や、複数のデータセットから効果的に学習する領域適応技術の研究も進めています。さらに、大規模言語モデルと視覚モデルの連携、視覚と言語の統合的な理解に関する研究も行われており、日本語を含むマルチリンガル対応のビジョン・言語資源の構築にも注力しています。 加えて、音声から3次元顔アニメーションを生成する技術、音声分離、ユーモアのある画像説明の自動生成など、より広いモダリティに対応した生成モデルの研究も展開しています。これらの研究は、ノイズの混在したデータやラベルが不完全なデータから学習する実践的な状況に対応する方法論の開発にも結びついています。

※ AI(Claude)が、公開されている論文要旨から研究の問い・手法・主要な発見を事実情報として抽出・再構成して自動生成しています。誤りを含む可能性があるため、正確性は研究室公式情報でご確認ください。

外部リンク

関連研究室(8 件)

研究成果(149 件)

続きを表示(残り 139 件)

科研費(0 件)

まだデータがありません(KAKEN 取り込み後に表示)。

所属学会・役職(0 件)

まだデータがありません(学会データ連携後に表示)。