Kiyoharu Aizawa 研究室

主宰者:Kiyoharu Aizawa
東京大学

AI 要約(直近 5 年の研究成果)

本研究室は、画像や動画などの視覚情報とテキストを組み合わせた複数の領域の理解と処理に取り組んでいます。特に、日本文化に関連した視覚メディアの自動解析を重視しており、漫画のキャラクターや台詞の関係を学習させたり、日本語の大規模言語モデルを開発したりするなど、文化固有の知識を必要とする課題に力を入れています。また、食事の画像からレシピや栄養情報を検索したり、PDFなどの複数形式の文書から画像とテキストのペアを抽出したりするなど、実生活に役立つアプリケーションにも取り組んでいます。 手法としては、深層学習モデルやシーングラフ生成といった機械学習技術を活用しつつ、視覚言語モデルなどの大規模なニューラルネットワークの能力を評価・改善するためのベンチマークデータセットを構築しています。さらに、360度動画を用いた没入的な環境の構築や、顔認識・匿名化技術など、プライバシーと技術のバランスに関する研究も行っています。 主要な発見としては、実世界の複雑な状況では単一の視覚情報やテキスト情報だけでは不十分であり、成分や栄養など複数の観点から情報を統合することの重要性が示されています。また、検索や生成といった様々なタスクに対して、例に基づく学習(検索拡張)を組み合わせることで、データが限定的な場合でも質の高い結果が得られることが報告されています。

※ AI(Claude)が、公開されている論文要旨から研究の問い・手法・主要な発見を事実情報として抽出・再構成して自動生成しています。誤りを含む可能性があるため、正確性は研究室公式情報でご確認ください。

外部リンク

関連研究室(8 件)

研究成果(132 件)

続きを表示(残り 122 件)

科研費(0 件)

まだデータがありません(KAKEN 取り込み後に表示)。

所属学会・役職(0 件)

まだデータがありません(学会データ連携後に表示)。