2024年11月11日(月)、Zoomウェビナー形式で「シンガポール政府IMDAのAI安全性CTFプロジェクト」への参加報告会を開催しました。本ウェビナーは、生成AIの地域特有のリスクや懸念に対応するため、AIモデルの安全性を評価・改善するレッドチーミングの成果と課題を共有する目的で実施されました。
概要
- 開催日:2024年11月11日 (月) 10:00-11:00
- 会場: Zoomウェビナー
- 主催:東京大学国際高等研究所東京カレッジ、東京大学未来ビジョン研究センター、東京大学次世代知能科学研究センター、東京大学B’AI Global Forum、日本ディープラーニング協会
- 後援:情報学研究所大規模言語モデル研究開発センター、日本AIセーフティ・インスティテュート
背景
生成AIの利用が進む一方で、AIモデルが地域特有の文化や言語におけるリスクを正確に反映し、安全性を確保することが重要視されています。しかし、現状のAI安全性評価は欧米中心の視点が主流で、地域特有のリスクに対応した取り組みが十分ではありません。シンガポール政府が主催するCTFプロジェクトは、各国の多様な視点を取り入れ、AIの安全性を強化することを目的としています。
内容
本ウェビナーは、東京大学東京カレッジ准教授/JDLA理事の江間有沙氏による開会挨拶で幕を開けました。江間氏は、大規模言語モデル(LLM)が生成する有害コンテンツや文化的バイアスへの対応の重要性を強調し、日本独自の視点を踏まえた取り組みの必要性を訴えました。また、LLMの安全性やガバナンスに関する議論を推進するため、幅広いステークホルダー間の協力が不可欠であると述べました。
続いて、日本チームの派遣団長としてプロジェクトに参加した関根聡教授(NII-LLMC/理研AIP)が、AIモデルの安全性確保に向けた進捗と成果を発表しました。加えて、日本ディープラーニング協会の築地テレサ氏から、シンガポールでのCTFチャレンジの具体的な取り組みや今後の展望について説明がありました。
また、ウェビナー後半では参加者との質疑応答を通じ、生成AIのリスクにどう向き合うべきか、また地域特有の課題への対応策について活発な議論が行われました。
詳細レポート
詳しい内容については、以下のリンクから開催報告全文をご覧ください。
開催報告全文はこちら
講演の内容は、こちらのリンクからご視聴いただけます。
日本ディープラーニング協会YouTubeチャンネル
多文化・多言語対応の安全な大規模言語モデルの構築を目指して