CVPR (Conference on Computer Vision and Pattern Recognition)は、コンピュータビジョン、人工知能、機械学習、および関連分野の研究開発におけるトップカンファレンスの一つであり、業界最先端の研究成果がここで発表される。今年は 6 月 17 日から 21 日までの 5 日間、アメリカワシントン州シアトルのコンベンション・センターで開催された。本稿は、現地参加したリサーチャー2名(株式会社モルフォ)による現地レポート。興味深かったセッションの紹介を交えつつ、学会の様子を時系列で報告する最終DAY5となる。
DAY1 レポートはこちら
DAY2 レポートはこちら
DAY3 レポートはこちら
DAY4 レポートはこちら
6月21日(金)
あっというまに学会最終日である。名残惜しさを感じながら、いつも通り基調講演とオーラル・ポスターセッションに参加した。夕方ポスターセッション終了間際には多くの人が会場入り口で記念撮影をしているのが印象的であった。
基調講演会場
基調講演
自然界に存在する目に見えないパターンを、科学とアートの目を通して表現する芸術家、Sofia Crespo 氏による AI と芸術についての発表。海流パターンのシミュレーション結果を用いた映像作品や、地質、生物標本、海水などから自ら画像データセットを収集し、独自の拡散モデルを学習するなどの創作スタイルを、これまでの作品とともに紹介した。画像処理分野は言わずもがなアートとの結びつきが強い。アーティストの制作活動を効率化する技術開発だけでなく、アートそのものを生み出している様は、聴衆の興味を引いていた。質疑応答が活発に行われ、Sofia 氏自身も驚きと感謝を述べていた。
口頭発表
午前の 3D 再構成のセッション。本セッションは 5 本中 4 本が受賞候補にノミネートされており注目度が高かった。最優秀学生論文に選ばれた MIP-Splatting は、3DGS に見られる高周波アーティファクトを、2D/3D ガウシアンの特性を使った補正により改善する手法を提案した。午後の Image & Video Synthesis のセッションには、本学会の最優秀論文に選ばれた “Generative Image Dynamics” の著者が登壇。1 枚の画像から、被写体が自然な振動パターンで運動する動画を、拡散モデルで生成する研究だ。ハリー・ポッターに出てくるかえるチョコのおまけカードのような “魔法” が現実になりつつある。自然言語による指示でだまし絵を生成する “Visual Anagrams” の発表では、結果の美しさ、そして登壇者のユーモラスなトークで、発表中に 3 度も拍手が巻き起こるなど、大いに盛り上がりを見せた。
まとめ
CVPR は大盛況のうちに幕を閉じた。応用的な発表が多かったため、今日から仕事に活かせるアイデアの収穫があった。さらに、数多くの発表やそれに対する反響から、効率よくトレンドにキャッチアップできた。何より現地参加することの最大のメリットは、論文の著者に直接話を聞くことができることだ。論文には書かれていない本音や苦労話を聞き出せるだけでなく、研究者コミュニティとの繋がりを持つことでモチベーションも向上した。今後も CVPR との関わりを持ち続けるとともに、いずれは貢献できるよう力をつけたいと感じた。
(角田良太朗、三宅博史)
JDLAでは、2024年7月18日(木)16:00よりオンライン開催のCVPR2024 技術報告会を予定しています。イベントページはこちら