日本データベース学会 Newsletter 2023年10月号 (Vol.16, No. 5)
目次
-
ICML 2023 参加報告
小西 達也(株式会社KDDI総合研究所) -
KDD 2023 参加報告
竹内 孝(京都大学)
白上 龍(住友電工システムソリューション株式会社)
西田 遼(産業技術総合研究所) -
VLDB 2023 参加報告
山田 浩之(株式会社Scalar)
本号では ICML 2023,KDD 2023,VLDB 2023 の3件の国際会議の参加報告をご寄稿いただきました.それぞれの会議の様子や招待講演の内容,ご自身が発表された研究内容などについて紹介していただいております.ぜひご覧いただければ幸いです.
本号ならびにDBSJ Newsletterに対するご意見あるいは次号以降に期待する内容についてのご意見がございましたらnews-com[at]dbsj.orgまでお寄せください.
DBSJ Newsletter 編集委員会(担当編集委員 斉藤 和広)
1.ICML 2023 参加報告
小西 達也(株式会社KDDI総合研究所)
7月末にアメリカはハワイで開催されたICML 2023 (International Conference on Machine Learning) に,ポスター発表のため現地参加してきました.コロナ禍を経て2022年から現地開催が再開されたICMLですが,今回の開催は7,764名(うち40%が学生)の参加者,1,828件のポスター発表などを擁し,機械学習系国際会議の中でも最大級のものです.国別の参加者数では,日本は米国,韓国,英国,中国,カナダ,ドイツに続いて7番目の多さ.開催期間は計7日間で,最初の2日はExpo (Industry) Day(スポンサー企業によるセッション)とチュートリアル,3日間の本会議のあとにワークショップが2日間という充実の1週間でした.
Expo Dayでは差分プライバシー(Differential Privacy)や基盤モデル活用のための製品紹介など,AIの実応用上の課題を扱うスポンサー企業からの発表がメインです.チュートリアルでは昨今のAI技術の基礎となっているマルチモーダル学習や強化学習,自己教師あり学習などの技術について各2時間にわたり詳細な講義が行われました(講演によってはスライドが公開されているので,ご興味のある方は是非お調べください).本会議では,ポスター発表(3日間で6つのセッションに分割)と一部の論文について口頭発表がありました.各ポスターセッションは1.5時間ほどしかないので,めぼしい論文リストを予め作っておくと時間切れにならず安心ですが,一方で,人だかりのあるポスターに偶然巡り会うのもリアル開催の醍醐味でもあります.内容はやはりLLM・基盤モデルに関する研究が大半を占めていましたが,グラフ学習,連合学習,強化学習のようなトピックも多く目に留まります.ワークショップでは,特定の技術や分野に絞った発表や議論が集中的に行われました.ヘルスケアのような見慣れたものから天体物理学への適用のようなものまであり,実に幅の広いラインナップです.
私は”Parameter-Level Soft-Masking for Continual Leanring”というタイトルでポスター発表を行いました(イリノイ大学シカゴ校で客員研究員として共同研究した成果です).継続学習(Continual Learning)における主要課題である「破滅的忘却の抑制」「知識転移の促進」に加えて,従来研究で見過ごされてきた「新しいタスクに対する表現能力の維持」という要件を同時に満たすsoft-maskingという手法を提案しています.
発表会場とは別に設営されていた展示会場では,スポンサー企業によるブース出展もありました.やはり目を引くのは基盤モデルなどのAIモデルを運用するサービス(=AIOps)の出展です.複数社が軒を連ね,APIを利用したモデルの管理ツールについてデモを交えて宣伝をしていました.参加者の興味も高く,常に人だかりができていたのが印象的です.多くのブースでは「インターン募集」の張り紙も見られ,優秀な学生を採用する場としても一役買っているようです.また,会議中にお話しした方の中でも,調査目的で聴講参加している人を多く見かけました(海外企業,日本企業とも).
次回のICML 2024はオーストリア,ウィーンで7/21-27の日程で開催予定です.現時点では今年と同じくVirtual Pass(オンライン参加)も可能なようですが,是非現地での参加をおすすめします.
著者紹介:
小西 達也(株式会社KDDI総合研究所)
2.KDD 2023 参加報告
竹内 孝(京都大学)
白上 龍(住友電工システムソリューション株式会社)
西田 遼(産業技術総合研究所)
KDD 2023 (29TH ACM SIGKDD CONFERENCE ON KNOWLEDGE DISCOVERY AND DATA MINING)が,2023年8月6日から8月10日までアメリカのカリフォルニア州ロングビーチで開催されました.KDD 2023はResearchトラックとApplied Data Scienceトラックの2本立てとなっており,いずれのトラックでも採択された研究は口頭とポスターで発表が行われました.本会議では3件の基調講演がEd Chi氏 (Google),Eric Horvitz氏(Microsoft),Mihaela van der Schaar(University of Cambridge)より行われました.ワークショップはフルデイが10件,ハーフデイが24件,チュートリアルはレクチャー形式が26件,ハンズオン形式が8件が開かれるなど盛況な様子で,現地参加のみの開催で参加者数は2250人となったそうです.これほど大規模な国際会議を実行するためには,主催者側が準備に費やす労力も膨大となるようで,Organizing Committeeでは,週1回3時間のミーティングは30回行われ,General Chairに至っては週10時間ほどの作業を50週間行ったそうです.
さて,論文の投稿と採択に関する内訳が気になるところだと思われますので詳細な情報を次に紹介したいと思います.リサーチトラックは投稿数1416本,採択数313本,採択率22% ,アプライドデータサイエンストラックは投稿数725本,採択数184本,採択率25%とのことでした.トピックとしては,グラフとネットワークが最大の票田となっており,推薦システム,逐次時系列データがそれに続き,いずれもデータマイニングの確固たるトピックとしての存在感がありました.また,これらに続くトピックとしては時空間データと分類が注目を集めていました.情報セキュリティや倫理と公平性とプライバシーに関する分野も多くの投稿を集めており今後も注目のトピックと思われます.
私たちのチームからは,リサーチトラックで1本,アプライドデータサイエンストラックで1本の研究が採択されました.1本目は「Causal Effect Estimation on Hierarchical Spatial Graph Data」と題した論文で,産総研と京都大学の共同研究の成果です.この研究では,空間の任意の座標で実行される介入が,その後の結果に与える影響を選択バイアスを持つ空間データから学習するための,階層空間構造を活用するグラフニューラルネットワークであるSpatial Intervention Network (SINet)を提案しました.新国立劇場からの数千人規模の避難をシナリオとして,非常口への経路誘導が避難時間の分布にどのような影響を与えるかを予測する実験で,SINetは既存のモデルよりも大幅な予測性能の改善を達成しました.実験ではマルチエージェントシミュレータを用いて作成した避難者の模擬的な移動データを使用しています.この研究で提案したフレームワークは,グラフ構造を用いて広範な空間データが扱えるため,今後はさらに応用範囲を拡張する予定です.
2本目は「QTNet: Theory-based Queue Length Prediction for Urban Traffic」と題した研究で,住友電工システムソリューション株式会社と京都大学の共同研究の成果です.この研究では,交通工学の知見に基づいて,混雑の変化と道路網の関係を学習する機能を持つ新たな時空間グラフニューラルネット(QTNet)を提案しました.警視庁から提供されたデータを用いた,東京都内1098箇所の道路における「1時間先の渋滞長を予測する実験」で,QTNetは平均して誤差40m以下という高精度な予測を達成しました.この結果は,現時点で最先端とされる深層学習手法よりも予測誤差を12.6%も削減することに成功しています.この手法は警視庁が取り組む AI とビッグデータを活用した交通管制システムの高度化プロジェクトにおいて,住友電工システムソリューション株式会社から警視庁へ納品されており,交通管制センターで数年内の実用に向けた検証が進められていることもあり,トラックの趣旨とも上手く合致していたのではないかと思います.
来年のKDD 2024は,2024年8月18日から8月22日まで,スペインのバルセロナで開催されるようです.2025と2026は北米での開催が予定されているようですが,2027はアジアが候補地となっているようです.今後の情報から目が離せませんね.
著者紹介:
竹内 孝(京都大学)
2011年早稲田大学大学院先進理工学研究科修士課程修了.2019年京都大学大学院情報学研究科博士後期課程修了.博士 (情報学).2011年より日本電信電話株式会社コミュニケーション科学基礎研究所,2020年より京都大学大学院情報学研究科助教.機械学習の研究と応用,および時空間データ解析に従事.
白上 龍(住友電工システムソリューション株式会社)
2019年京都大学大学院理学研究科修士課程修了.同年,住友電気工業株式会社に入社.住友電工システムソリューション株式会社にて交通管制システムの開発及びそこで利用されるAIの研究開発に従事.
西田 遼(産業技術総合研究所)
2023年東北大学大学院情報科学研究科博士後期課程修了.博士(情報科学).同年,産業技術総合研究所に特別研究員として入所.交通や群集移動を対象としたエージェントベースのモデリングやシミュレーションおよび機械学習の応用研究に従事.
3.VLDB 2023 参加報告
山田 浩之(株式会社Scalar)
2023年8月28日から9月1日まで,カナダのバンクーバーにて開催された49th International Conference on Very Large Data Base(以下 VLDB2023)に参加しました.VLDBはデータ工学,データベース分野でのトップカンファレンスです.VLDB 2023は基本は対面で行われ,ビザの影響で対面で参加できない方だけオンラインで発表する形式で開催されました.参加者は全体で1066人で,対面での参加が96%,オンラインでの参加が4%でした.
VLDB 2023においては,Research Track論文は1074本投稿のうち266本が採録され,Industry Track論文は75本投稿のうち29本が採録されています.ResearchTrackにおける分野別投稿数の上位は,ML, AI, and Databasesで185本,Database Enginesで144本,Data Mining and Analyticsで128本,Graph and Network Dataが127本でした.今年のIEEE ICDE 2023にも参加しましたが,ICDEではData MiningとGraph分野の投稿数が全体のかなり大きな割合を占めていたのですが,VLDBではData Enginesが上位にきていたりと,全体としてデータベースシステムの研究の割合が他のデータベース会議と比較して若干多い印象を受けました.国別のResearch Track論文の投稿数ですが,上位から中国本土,米国,ドイツの順番で,残念ながら日本は10位以内に入っていませんでした.もっと日本のデータベースの分野を盛り上げて,日本から投稿数を増やさないといけないなと,気が引き締まりました.
キーノートの一つとして,中国AlibabaのFeifei Li氏から,「Modernization of Databases in the Cloud Era: Building Databases that Run Like Legos」というタイトルでの発表がありました.Alibabaでは,クラウドデータベースのモダナイゼーションにおいては四つの重要なトレンド(embracing cloud-native architecture,cloud platform integration/orchestration,co-design for data fabric,AI-first/AI-inside)がある考えており,彼らのクラウドデータベースであるPolarDBを,その四つのトレンドに対してどう拡張していっているか,というお話をされていました.かなり情報量が多いプレゼンでしたが,Alibabaのデータベース分野における研究開発の本気度が伝わってきました.また,Alibabaは,Industry Trackにおいて,29本のうち7本もの論文を通しており,勢いと実行力においても群を抜いていた印象を受けました.
私は,Industry Trackにて「ScalarDB: Universal Transaction Manager for Polystores」という論文に関する発表をしました.論文では,私が所属するScalarというスタートアップで研究開発しているトランザクションマネージャ製品であるScalarDBにおいて,既存の研究をどのように拡張し,どのような技術的選択をし,現実世界のプロダクトとして作り上げる上での種々の課題をどう解決しかたについて論述しています.幸運にも一番大きな会場で,GoogleやAlibabaと並んで発表できたため,多くの方が聴講してくださり,多くの質問とフィードバックをもらうことができ,大変有意義な経験をすることができました.
VLDB 2024は,中国の広州で開催される予定です.50回目という記念すべき回であり,開催地が日本からも近いこともあるため,ぜひ投稿を検討してみてはいかがでしょうか.
著者紹介:
山田浩之(株式会社Scalar)
株式会社Scalar CEO兼CTO.データベースミドルウェア製品の研究開発に従事しています.博士(情報理工学).
過去のNewsletterはこちらです。