日本データベース学会 Newsletter 2025年8月号 (Vol.18, No. 4)

　暑中お見舞い申し上げます。梅雨明けとともに本格的な夏を迎えた8月の候、皆様におかれましてはお変わりなくお過ごしでしょうか。今年は例年以上の猛暑が予想されておりますが、どうぞお体にお気をつけてお過ごしください。皆様のご健康とご多幸をお祈り申し上げます。

　本号では、国際会議 ICWSM 2025とCVPR 2025の参加報告、NTCIR-18の開催報告をご寄稿いただきました。会議の動向やご自身の研究内容など、お楽しみいただければ幸いです。

　本号並びに DBSJ Newsletter に対するご意見あるいは次号以降に期待する内容についてご意見がございましたら news-com [at] dbsj.org までお寄せください。

DBSJ Newsletter 編集委員会（担当編集委員廣中詩織）

１．ICWSM 2025 参加報告

村山太一（横浜国立大学）

　2025年6月23日から26日にかけて、ICWSM2025 (The 19th International AAAI Conference on Web and Social Media) がデンマークのコペンハーゲンで開催されました。ICWSMという国際会議はあまり馴染みが無いかもしれないですが、Webやソーシャルメディア上のデータを活用して社会現象を分析する計算社会科学を主たるテーマとした研究を中心に発表される国際会議となります。今年の採択論文数は約140件、参加者は約370名と、他の大規模なAI系会議と比較すると小規模なものとなっています。国別の参加者比率を見てみると、アメリカが1位、ドイツが2位と欧米からの参加者が大半を占める一方、他のAI系会議で高いプレゼンスを示す中国からの参加者比率は7位でした。日本はどうかというと、参加者比率2%で10位、筆頭著者の採択論文は4件となっており、まだまだプレゼンスを高める余地がありそうです。

　本会議の大きな特徴として、会期中のすべての口頭発表がシングルトラックで進行します。これにより、自身の専門分野以外の多様な研究に広く触れることができますが、発表者一人あたりの持ち時間は5分と非常に短く、要点を凝縮したプレゼンテーションが求められます。どんどん規模が大きくなっていく分野ということもあり、さすがに、来年あたりはシングルトラックは無理でしょと思うのですが、来年はどうなってるのでしょう？

　採択論文のテーマとしては、例年通りHate Speechや政治的分極（Political Polarization）といった社会課題に関する研究が活発でした。また、「Reddit」「TikTok」といった具体的なプラットフォーム名を冠したセッションが組まれるなど、個々のメディアの特性を深く掘り下げる研究も目立つ印象です。加えて、他の国際会議と同様にLLM（大規模言語モデル）の活用も重要なトピックとなっており、LLMを用いた社会シミュレーションが現実社会をどの程度反映できるかを検証する研究や、LLMを活用した新たな教師なしクラスタリング手法の提案など多くの発表がありました。執筆者が発表した内容もこのカテゴリーに当てはまるものとなっています。

　学会全体の雰囲気やコペンハーゲンの様子は、同じく併設ワークショップ（MisD）に参加された同志社大学の寺本さんが執筆された素晴らしい参加報告記からも伺うことができます。ご興味のある方は、ぜひそちらもご覧ください（https://www-mil.cis.doshisha.ac.jp/portfolio/icwsm-ws-2025/）。

　来年のICWSM2026は、アメリカのロサンゼルスで開催予定です。本会議は少し独特な査読システムを採用しており、年間を通して3回の投稿締切があります。一度の査読で採択・不採択が判定される場合もありますが、一部の投稿論文は「Revision」や「Rebuttal」という形で次の投稿サイクルにて再評価の機会が与えられます。そして2回目のReviewによって、最終的に採択・不採択が決定されます。採択率は現在公開されておりませんが、ラウンド制が採用される3年前までは20%前後であり、いわゆる計算社会科学の難関国際会議として位置付けられています。ソーシャルメディア分析や計算社会科学の最新動向を知る上で非常に有益な会議ですので、興味を持たれた方はぜひ投稿・参加を検討されてはいかがでしょうか。

著者紹介：
村山太一 (横浜国立大学)
2019年に奈良先端科学技術大学院大学博士前期課程修了、2022年に奈良先端科学技術大学院大学博士後期課程修了。博士（工学）。現在、横浜国立大学助教。Web情報工学の研究に従事。

２．CVPR 2025 参加報告

松井勇佑（東京大学）

【概要】2025/6/11から2025/6/15まで、Computer Vision and Pattern Recognition (CVPR) がアメリカのナッシュビルにて開催されました。本会議はComputer Vision (CV) 分野の最難関の会議です。CVPRは過去20年のAI技術の大進展の中心に位置する会議の１つであり、近年は投稿数が１万件をこえるなど肥大化が進んでいます。私は本会議に参加し、論文発表を行いました。本記事ではCVPRの雰囲気、最近の潮流から、こまかい面白い点までご紹介できればと思います。時代の中心の会議だからこそ面白い点もあり、不可思議な点もあります。

【今目の前で時代が動いている】CVPRでは論文発表（ポスター・オーラル）、ワークショップ、チュートリアル、キーノート、など一般的な国際会議の内容に加え、大規模な企業展示も行われます。そのどれもが最新の技術を紹介するものであり、CVPRに参加することで得られる知的な刺激は大きいです。印象深かったのはキーノートです。Metaの研究者による、オープンなLLMモデル「llama」を作ったキーノート発表がありました。このllamaを作るという作業は、発表者が述べていた言葉を借りると「ロケットを打ち上げる」ほど大規模なものだそうです。大量の様々な分野の研究者が関係し、それこそロケットを作るような分業や
プロジェクトマネジメントを経てllamaは作られていました。LLMを作ることは大規模で難しいことは誰でも知るところですが、あらためてそれがロケット産業のようなものであると思い知らされたのでした。また、もう一件のキーノートではGoogleのGeminiのチームによるembodied AIの研究（ロボットの研究）が紹介されていました。近年のVision Language Model (VLM)の発展に従い、ロボットが自分で外界を判断し、オペレータからの自然言語入力でロボットを動かすという技術は信じられないほど発展しています。この分野の進展の早さは驚くべきことです。

【技術の移り変わり】また、私はCVPR2023に参加し今年のCVPR2025に二年振りに参加したのですが、2023のころ大流行していた「NeRF」という三次元復元の技術に関して、今年はほとんど見ませんでした。この技術の移り変わりの激しさには圧倒されます。Gaussian Splattingという上位互換のような技術が登場したことによりNeRFという単語が衰退したことは確かなのですが、それにしろわずか２年で「大流行」から「全く見ない」にまで技術流行が変化する流動性はすさまじいものです。ベストペーパーに目を向けると、CVPR2025のベストペーパーは「Visual Geometry Grounded Transformer」というものでした。これは、三次元復元に関する様々なタスクを、単一のTransformerで解くものです。いわゆる「ディープでポン」論文の最上位版というものです。CV全般に言えることですが、複雑なタスクに対しシンプルですがスケーラブルな技術を用い、大量のデータで取り組む、というここ１０年変わっていない基本的な筋を踏襲するものだと感じました。

【日本のプレゼンス】日本のプレゼンスは厳しい状況が続いていますが、日本からの投稿数や参加人数は増加しています。参加人数はアメリカ4000人、中国1500人、韓国580人、が上位３国としてあり、その次のグループにいます（日本・カナダ・ドイツ・イギリスがそれぞれ300人ほど）。フルペーパー中の著者の所属という点でいうと1%ほどで、すなわちCVPRに対する日本のプレゼンスは約1%程度、という印象です。これが多いか少ないかと言うと少ないので頑張らないといけないのですが、絶対人数としては300人もの日本からの人員がいるということは驚くべきことです。私は自分がポスター発表している際に日本の方から日本語で話しかけられることが多々あり、国際発表で日本語で発表した回数でいうと一番多かったかもしれません。また、オーラル発表ではNTTの武田さんによるGromov–Wasserstein問題に関する発表が印象的でした。

【不満】不満としては、Workshop/Tutorialの形態が変わってきてしまっていることがあげられます。もともとWorkshopとはある特定の研究分野に興味を持つ人々が集まってコミュニティを作ったり、よりトピックに特化した論文発表を聞くことが出来る場でした。しかし、近年のCVPRのWorkshopは多くのプログラムが有名研究者による招待講演で、そして招待講演者は単純に自分の最新の話をする、というような状況が増えてきています。また、チュートリアルでも、本来のチュートリアルは分野を概観できるまとめとしての発表が期待されるものですが、単純に自分の最新研究を発表するだけ、というものが増えてきています。これらによって、ワークショップであってもチュートリアルであっても、有名な研究者が単に自分の最近の研究を発表するだけ、となってしまっているものが多いことを感じました。この風潮はちょっと良くないなと感じます。

【細かい点】さて、最後にCVPRの面白い子ネタを紹介します。CVPRは朝食や昼食が配給されることが多いのですが、特に昔からやけにゆで卵が出されることで有名でした。なので、一部の研究者の間ではCVPRのといえばゆで卵、というネットミーム（？）になっています。今年もその予想通り、ゆで玉子が出ました。ただ、今年はコーヒーブレイク時にとてもボリュームがあるチーズやハムが大量に出たりしており、その満足度は高かったです。また、例年CVPRは会場が寒すぎることで有名（本当？）なのですが、今年もまた部屋内がものすごく寒く、体温調整に苦労しました。比喩でなく、外は熱くて半袖半ズボンでいいのに、オーラル会場では分厚いジャケットを着る、という形です。今後CVPRに参加される方は、長袖の上着をもってくることをお勧めします。

　　　　　　　　　　　　　　　　　　　　　　　　　食事会場の様子

著者紹介：
松井勇佑 (東京大学)

2016年，東京大学大学院情報理工学系研究科電子情報学修了．国立情報学研究所特任研究員，東京大学生産技術研究所助教を経て，2020年より東京大学大学情報理工学系研究科講師．コンピュータビジョン，データ構造，機械学習，特にベクトルデータベースや学習型データ構造など，大規模高速なAIシステムの基盤技術の研究に従事．博士（情報理工学）．

３．NTCIR-18 開催報告

若宮翔子（奈良先端科学技術大学院大学）

　NTCIRプロジェクトでは、情報検索、文書要約、情報抽出、質問応答などを含む、幅広い情報アクセス技術の研究を促進することを目的として、共同評価の取り組みを推進しています。第18回目のラウンドにあたるNTCIR-18 では、2024年3月から2025年6月までの約1年半にわたり、10件のシェアードタスクが実施されました。2025年6月10日から13日にかけて開催されたNTCIR-18 Conferenceでは、各タスクのオーガナイザーおよび参加者による成果報告が行われました。私は、NTCIR-18においてProgram Co-Chair、MedNLP-CHATタスクのオーガナイザーおよび参加者として参画しており、引き続き、NTCIR-19でもProgram Co-ChairおよびMedNLP-Callタスクのオーガナイザーを務めます。本報告では、NTCIR-18およびNTCIR-18Conferenceの概要に加え、NTCIR-19の概要についても紹介いたします。

== NTCIR-18 と NTCIR-18 Conference の概要 ==

　NTCIR-18 では、以下の7つのコアタスクと3つのパイロットタスクの計10タスクが開催されました：

– Automatic Evaluation of LLMs (“AEOLLM”)
– The Second Fair Web Task (“FairWeb-2”)
– Temporal Inference of Financial Arguments (“FinArg-2”)
– Hidden Causality Inclusion in Radiology Report Generation (“HIDDEN-RAD”)
– Personal Lifelog Organisation & Retrieval Task (“Lifelog-6”)
– Medical Natural Language Processing for AI Chat (“MedNLP-CHAT”)
– Natural Language Processing for Radiology (“RadNLP”)
– Searching Unseen Sources for Historical Information (“SUSHI”)
– Resource Transfer Based Dense Retrieval (“Transfer-2”)
– Unifying, Understanding, and Utilizing Unstructured Data in Financial Reports (“U4”)

　NTCIR-18のタスクは、大規模言語モデル（LLM）の評価、先進的な情報検索（IR）、ドメイン特化型の自然言語処理（NLP）、そして個人情報や歴史資料情報の管理など、多岐にわたる分野を対象としています。具体的には、AEOLLMはLLMの自動評価を目的とし、FairWeb-2およびTransfer-2は高度な検索課題に取り組んでいます。FinArg-2とU4は金融テキストの分析を対象とし、MedNLP-CHAT、HIDDEN-RAD、RadNLPは医療分野におけるNLPの応用に焦点を当てています。一方で、Lifelog-6やSUSHIは、それぞれ個人データや歴史情報の管理に関する課題に取り組んでいます。これらのタスクは、技術的な革新だけでなく、公平性や社会的影響にも重点を置いており、NLPおよびIR技術が情報アクセスの多様な側面に応用されていることを示しています。

　NTCIR-18は、2024年3月に各タスクの運営が開始され、同年3月29日にキックオフイベントが開催され、2025年1月に評価結果が返却されるというスケジュールで進行しました。日本、インド、中国本土、台湾、韓国、アイルランド、アメリカなど、アジアを中心とした多様な国や地域から、計113チームがいずれかのタスクに参加登録し、そのうち67チームが結果を提出しました。NTCIR-18 Conferenceでは、87本のシステム論文が発表されました。

　NTCIR-18 Conferenceでは、各タスクのオーガナイザーによるタスク概要の報告に加え、Maarten de Rijke教授（アムステルダム大学）およびDouglas W. Oard教授（メリーランド大学）による基調講演、Ian Soboroff博士（NIST、USA）によるTREC（米国版NTCIR）の報告、さらに、LLMを用いた情報検索評価の新たな可能性と課題に関するパネルディスカッション、タスクごとのセッションが行われました。会議には196名が参加し、盛況のうちに終了しました。

== NTCIR-19 タスク ==

　NTCIR-19は、2025年9月から2026年12月にかけて開催されます。NTCIR-19では以下の11タスクが実施されます：

– Automatic Evaluation of LLMs 2 (“AEOLLM-2”)
– Composed Access to Multimodal E-commerce Objects (“CAMEO”)
– Data Analytics for aGRicultural Information (“DAGRI”)
– Fact-based Event-centric Human-value Understanding (“FEHU”)
– Argument Quality Assessment of Financial Forward-Looking Statements (“FinArg-3”)
– Hidden Causal Reasoning in Radiology Report Generation (“HIDDEN-RAD2”)
– Personal Lifelog Organization Retrieval Task (“Lifelog-7”)
– Medical Natural Language Processing for emergency Call (“MedNLP-CALL”)
– RAG Responses Confident and Correct? (“R2C2”)
– Multinational, Multilingual, Multi-Industry Regulatory Compliance Checking (“RegCom”)
– Cross-modal Claim Verification in Scientific Papers (“SciClaimEval”)

　さらに、NTCIR-19では追加のタスク募集も行われており、2025年9月3日に開催されるキックオフイベントにて、全てのタスクの概要が紹介される予定です。これから研究を始めようとする方、データの準備や評価作業に煩わされることなく手法の提案に専念したい方、あるいはタスクへの参加を通じて最先端の技術に触れたい方など、幅広い皆さまのご参加をお待ちしています。

リンク
NTCIR-18: https://research.nii.ac.jp/ntcir/ntcir-18/index.html
NTCIR-19: https://research.nii.ac.jp/ntcir/ntcir-19/index.html