日本データベース学会

日本データベース学会 Newsletter 2025年10月号 (Vol.18, No. 5)

目次

  1. ICML 2025 参加報告
    金森 憲太朗(富士通株式会社)
  2. SPIRE 2025 参加報告
    三重野 琢也(電気通信大学)
  3. IJCAI 2025 参加報告
    枌 尚弥(NEC)

 爽秋の候、皆様におかれましてはお変わりなくお過ごしでしょうか。日ごとに秋らしさが増し、過ごしやすい季節となってまいりました。今年は昼夜の寒暖差も大きいようですので、お体に十分お気をつけてお過ごしください。皆様のご健康とご多幸を心よりお祈り申し上げます。
 本号では、国際会議 ICML 2025、SPIRE 2025、IJCAI 2025の参加報告をご寄稿いただきました。会議の動向や研究内容など、お楽しみいただければ幸いです。
 本号並びに DBSJ Newsletter に対するご意見あるいは次号以降に期待する内容についてご意見がございましたら news-com [at] dbsj.org までお寄せください。

DBSJ Newsletter 編集委員会
(担当編集委員 佐々木 耀一)


1.ICML 2025 参加報告

金森 憲太朗(富士通株式会社)

 2025年7月13日から19日にかけて、カナダのバンクーバーにて、機械学習分野のトップカンファレンスである ICML 2025 (Forty-Second International Conference on Machine Learning) が開催されました。私は採択された論文発表のために現地参加しましたので、本稿ではその報告をさせていただきます。会議は、最初の2日間がスポンサー企業による展示とチュートリアル、続く3日間が本会議、そして最後の2日間がワークショップという構成でした。本会議の参加者数は9700人を超え、その注目度の高さがうかがえます。本会議では、Jon Kleinberg 氏や Anca Dragan 氏をはじめとする世界的に著名な研究者らによる6件の招待講演が行われました。私個人としては、ベイズ最適化や劣モジュラ最適化の大家である Andreas Krause 氏の講演が特に興味深く、論文や教科書でしか知らなかった著名な研究者の話を直接聞けるのは、国際会議の醍醐味であると改めて感じました。

 今年は、Main Conference Track に12107件の論文が投稿され、3260件が採択されました(採択率26.9%)。投稿数は前年比32%増加しており、機械学習研究の競争激化を示しています。採択論文のうち、査読評価の高かった上位2.6%(321件)が Spotlight Paper に、さらに上位0.8%(108件)が Oral Paper にそれぞれ選定されました。発表形式としては、すべての論文がポスター発表を行い、Oral Paper に選定された108件は口頭発表も行われました。ポスターセッションは6度に分けられ、一度に500件以上の発表が並行して行われる大規模なものでした。

 採択論文の傾向としては、昨年に引き続き、生成AIや大規模言語モデル(LLM)に関するものが大多数を占めていました。中でもLLMエージェントに関する論文は昨年から大幅に増加し、主要なトレンドの一つであることが見て取れます。加えて、LLMの挙動を制御するためのモデル編集技術やアンラーニング技術、生成過程を理解するための機械論的解釈性(mechanistic interpretability, MI)、生成結果を評価するためのベンチマークに関する論文も増加しており、LLMの社会実装に必要な安全性や信頼性を確保するための研究が活発化していることが示唆されます。この他、分子設計や物性予測といった自然科学分野への応用(AI for Science)や、ロボティクスとの融合など、分野横断的な研究も盛んに行われていました。

 他の国際会議には見られない ICML の特色として、Main Conference Track とは別に Position Paper Track が去年から新設されています。これは、機械学習分野に重要な貢献をするものの、伝統的な学会論文の形式には収まらない研究を奨励し、研究コミュニティで議論すべき時宜にかなったトピックに関する議論を促進することを目的としています。今年は、投稿された361件のポジション論文のうち73件が採択されました(採択率20.2%)。個人的には、「査読システムの崩壊を防ぐために、査読の質に関して著者-査読者間の双方向フィードバックの機会を導入したり、質の高い査読を実績として評価することで査読者に対して報酬を与える制度を設けたりするべき」と主張する論文 “Position: The AI Con ference Peer Review Crisis Demands Author Feedback and Reviewer Rewards (Kim et al.)” が特に印象に残りました。

 最後に我々の採択論文 “Algorithmic Recourse for Long-Term Improvement (Kanamori et al.)” について簡単に紹介します。アルゴリズム的償還(algorithmic recourse)は、機械学習モデルから肯定的な判定結果(例えば、融資の承認)を得るためにユーザがとるべきアクションを説明するフレームワークであり、実社会におけるデータドリブンな意思決定の信頼性を向上させる技術として近年注目されています。この論文では、アクション実行結果のフィードバックを活用することで、予測結果だけでなく現実世界での結果も改善するようなアクションを提示できる新技術を提案し、その有効性を理論と実験の両面で実証しました。ポスター発表では、大学・企業問わず多くの研究者と実りのある議論を行うことができました。

 ICML 2026 は、韓国のソウルにて2026年7月6日から12日の日程で開催される予定です。機械学習分野にご興味のある方は、論文投稿や現地参加を検討されてみてはいかがでしょうか。

              会場の外観

著者紹介:
金森 憲太朗(富士通株式会社)

liu
富士通株式会社 人工知能研究所 研究員。2022年3月 北海道大学大学院情報科学院情報科学専攻博士後期課程修了(短縮修了)。博士(情報科学)。同年4月より現職。2020月4月から2022年3月まで日本学術振興会特別研究員(DC1)。2023年10月から現在 JST ACT-X「次世代AIを築く数理・情報科学の革新」領域一期生。専門は機械学習と数理最適化で、特に説明可能性や解釈可能性に関する研究に従事。

2.SPIRE 2025 参加報告

三重野 琢也(電気通信大学)

 2025年9月8日から10日までの3日間、イギリス・ロンドンの City St George’s University of Londonで開催された 32nd International Symposium on String Processing and Information Retrieval (SPIRE 2025) に参加しましたので、ご報告いたします。

 本会議は、文字列処理および情報検索に関する最新の研究成果を発表・議論する場です。理論計算機科学分野に位置づけられますが、純粋な理論研究から実応用を見据えた研究まで幅広く扱う点が特徴です。また開催地にも特色があります。SPIREはブラジル発のワークショップを起源とし、ほぼ隔年で欧州と中南米(あるいはその他の地域)を行き来して開催されています。理論計算機科学分野の国際会議の多くが欧州や北米を中心に開催される中、このように中南米開催を継続する例は極めて珍しく、中南米のみで開催されている理論系国際会議LATIN とも異なる独自の存在感を示しています。SPIRE 2025 の参加者は44名で、会期中には1件の招待講演、2件の基調講演、23件の口頭発表(レギュラー論文17件、ショート論文6件)が行われました。論文の採択率はおよそ55%でした。

 私は本会議にて2件の共著論文 “Longest Unbordered Factors on Run-Length Encoded Strings” および “On the number of MUSs crossing a position”を発表しました。本稿では、後者の研究で扱った MUS (Minimal Unique Substring)について少しご紹介させていただきます。

 本研究で扱った (Minimal) Unique Substringとは、入力文字列中にちょうど一度だけ出現する部分文字列(以下、ユニーク文字列)を指します。入力文字列中に現れるユニーク文字列を発見する問題は、文字列アルゴリズム分野において盛んに研究されている重要な計算問題の一つです。実は、ユニーク文字列研究の火付け役となったのは、ICDE 2013 において Jian Peiらによって発表された論文 “On Shortest Unique Substring Queries” でした。Peiらは同論文で、ユニーク文字列に関連する新たな計算問題とその解法を提案し、実装においては実データ上での有効性を示しました。この成果を受けて、SPIREコミュニティを中心とする研究者らは、理論的な計算量の改善や、先進的な文字列データ構造を用いた高速・省メモリな実装、さらには多様な亜種問題の考察へと研究を広げていきました。

 このように、データベース分野のトップ会議で発表された成果が理論計算機科学分野の研究者の目に留まり、そこから新たな研究の潮流が展開していったことは、非常に喜ばしいことと思います。まさに、分野を越えて研究が発展していった好例といえるでしょう。そのような研究テーマに関われていること、またユニーク文字列研究の短くも興味深い歴史を御会のニュースレターでご紹介する機会をいただけたことを、非常に嬉しく、光栄に思っております。なお、ユニーク文字列計算の歴史やその後の理論的発展については、2020年のサーベイ論文 “A Survey on Shortest Unique Substring Queries” に詳しくまとめられています。

 最後に、SPIREの会議名にも含まれる「情報検索 (Information Retrieval)」は、データベース技術やデータマイニングとも密接に関係するキーワードです。本稿をご覧になっているデータベース関連分野の研究者の皆様におかれましても、今後の論文投稿先の一つとしてSPIRE をご検討いただければ幸いです。

【会議ページリンク】

https://sites.google.com/view/spire-2025

              会場の外観

著者紹介:
三重野 琢也(電気通信大学)

liu
横浜国立大学大学院環境情報学府博士課程後期在学中。2024 年横浜国立大学大学院環境情報学府博士課程前期修了。データベース、電気自動車ライフログシミュレーション・時系列データ分析枠組の研究・開発に従事。日本データベース学会学生会員.情報処理学会学生会員。

3. IJCAI 2025 参加報告

枌 尚弥(NEC)

概要:
 2025年8月にInternational Joint Conference on Artificial Intelligence(IJCAI)が開催されました。IJCAIは、AI分野におけるtop-tier会議の1つで、AIに関する幅広い研究が発表されています。私は主著論文発表のため本会議@カナダに参加してきましたので、本会議の雰囲気や発表論文の傾向などご紹介します。

会議の概要・発表論文の傾向など:
 今年のMain trackへの投稿数は5,806件、採択数は1,023件(採択率約18%)で、採択率は例年を維持しつつも投稿数・採択数は増加傾向にありました(採択論文数:791@2024年、643@2023年)。IJCAIでは、Survey trackが設けられています。Survey trackへの投稿数は265件、採択数は52件で、採択率はMain trackとほぼ同等の約20%でした。Survey trackとはいえ本文の上限ページ数は7であり、短く密度の濃い論文が多いです。なお、全ての採択論文はQA無の口頭発表とポスター発表を行う必要がありました。

 オープニングにて、国別・カテゴリ別の論文投稿数が発表されました。国別の投稿数では、中国からの投稿が66%と圧倒的でした。次いでアメリカ(8%)、韓国(3%)でした。日本からの投稿数は12位(1%)と少し寂しい状況でした。

 投稿数の上位3カテゴリは、Machine Learning (約28%)、Computer Vision(約22%)、Data Mining(約10%)でした。6, 7位には、Agent-based and Multi-agent systems (約4%)とAI Ethics, Trust, Fairness(約4%)がランクインしており、近年の研究の潮流が反映されているように感じました。カテゴリ別で見るとML、CVが大半を占めていますが、発表を聞いていると自然言語処理、最適化、知識処理、ゲーム理論なども多くありAIに関する多様な分野が取り上げられている印象を受けました。

 招待講演の内容も多岐にわたり、AI Safety, Nuerosymbolic AI, Interpretabilityなどが取り上げられていました。個人的には、Bernhard Schölkopf氏の招待講演が非常に印象的でした。講演では、いかにして疑似相関を排除し宇宙の観測を行うかという話題をご自身の研究を交えて紹介されていました。

 Art Galleryと称して、ポスター会場ではAIを利用したArt作品も多く展示されていました。特に、理研 浜中雅俊氏らのRoboSax [1]では、自然なメロディ生成と実際の楽器を用いた自動運指システムのデモをされており、非常に印象的でした。

 我々の発表も少し紹介させていただきます。我々の研究では、画像検索システムの利便性向上のために、検索結果に表れる画像の見た目や撮影時刻などの多様性をコントロールする手法を提案しています。提案法を使うと、例えば「猫」と入力するだけで、日中や夜間など様々な時間に撮影された猫でかつ、眠っていたり・走り回っていたりと多様な見た目をした猫を見つけてくることができます。提案法は行列式点過程を拡張した手法になっています。詳しくは[3]をご覧ください。

余談:
 今年のIJCAIは、no-show減少のために、特殊な開催形態をとっていました:本会議をカナダ(2025/8/19-25)にて、サテライトイベントを中国(2025/8/29-31)にて開催する形態でした。自らの研究をどちら(もしくは両方)の会場で発表するかは、著者が自由に選択できました。私は先述した通り、本会議ということでカナダの方に参加してきました。本会議というだけあり、TutorialやWorkshop・招待講演などの数は多かったです。

 他方で、(多くの方が予想されているかもしれませんが、)論文発表数は中国開催の方が圧倒的に多かったようです。IJCAI ホームページ [2]のProgramから推定したところ、カナダで265件、中国で756件の発表数でした。特に、私の専門分野であるCVに関する研究の多くは中国会場で発表されているように感じました。この開催形式が今後も継続されるかはいまのところ不明ですが、本会議に参加するだけでは大半の発表を聞くことができないというのは、少々残念でした。

 最後に、私が会期中に観測できた範囲で資料が公開されているTutorialへのリンクを記します[4-11]。興味がある方はご覧ください。

リンク:
[1] RoboSax: <https://aip.riken.jp/news/robosax/?lang=ja>

[2] IJCAI 2025 HP: <https://2025.ijcai.org/>

[3] 筆者らの研究:<https://github.com/NEC-N-SOGI/msdpp>

以下Tutorialへのリンク
[4] Neuroevolution of Intelligent Agents: <https://cs.utexas.edu/~risto/talks/ijcai25-tutorial/>

[5] AI Meets Algebra: <https://algebra4ai.github.io/>

[6] Federated Compositional and Bilevel Optimization: <https://hcgao.github.io/tutorial_ijcai2025.html>

[7] Deep Learning for Graph Anomaly Detection: <https://sites.google.com/view/ijcai-tutorial-on-ad/home>

[8] Supervised Algorithmic Fairness in Distribution Shifts: <https://sites.google.com/view/ijcai25-tutorial-fairness/home>

[9] Fairness in Large Language Models: A Tutorial: <https://fairness-llms-tutorial.github.io/>

[10] Computational Pathology Foundation Models: Datasets, Adaptation Strategies, and Evaluations: <https://sites.google.com/view/ijcai25-tutorial-cpath/home>

[11] Evaluating LLM-based Agents: Foundations, Best Practices and Open Challenges: <https://github.com/Asaf-Yehudai/LLM-Agent-Evaluation-Survey/tree/main/Tutorials>

 

              会場の様子

著者紹介:
枌 尚弥(NEC)
 2019年に筑波大学大学院博士前期課程、2022年に筑波大学大学院博士後期課程修了。博士(工学)。現在、日本電気株式会社 ビジュアルインテリジェンス研究所 研究員。画像認識の研究に従事。


過去のNewsletterはこちらです。