日本データベース学会 Newsletter 2024年4月号 (Vol.17, No. 1)
目次
-
DEIM2024 開催報告
渡辺 知恵美(筑波技術大学) -
AAAI2024 参加報告
赤木 康紀(日本電信電話株式会社) -
IEEE BigComp2024 参加報告
莊司 慶行 (静岡大学) -
EMNLP2023 参加報告
宮野 稜大(大阪大学)
本号では、 DEIM2024の開催報告をご寄稿いただいております。 また、国際会議AAAI2024、IEEE BigComp2024、EMNLP2023の参加報告もご寄稿いただいております。会議の動向やご自身の研究内容などのご紹介となります。
本号ならびにDBSJ Newsletterに対するご意見あるいは次号以降に期待する内容についてのご意見がございましたらnews-com[at]dbsj.orgまでお寄せください.
DBSJ Newsletter 編集委員会(担当編集委員 天方 大地)
1.DEIM2024 開催報告
渡辺 知恵美(筑波技術大学)
第16回データ工学と情報マネジメントに関するフォーラム
第22回日本データベース学会年次大会(DEIM2024)
https://confit.atlas.jp/guide/event/deim2024
主催:日本データベース学会
電子情報通信学会データ工学研究専門委員会
情報処理学会データベースシステム研究会
協力:姫路観光コンベンションビューロー
日程:2024年 2 月 28 日(水)? 3 月 5 日(火)
会場:オンライン開催(1?3日目)
アクリエひめじ(4,5日目)
○ 開催概要
データ工学と情報マネジメントに関するフォーラム/日本データベース学会年次大会(DEIM)は,データ工学と情報マネジメントに関する様々な研究テーマの討論・意見交換を目的とした研究集会です。2019年?2022年のオンライン開催を経て、DEIM2023から直列ハイブリッド開催(最初の3日間に一般発表をオンライン開催、4?5日目を現地開催)となりました。DEIM2024も昨年に引き続き直列ハイブリッド形式で開催し、一般発表420件、参加者800名、そのうちオンサイト参加は約600名と大盛況でした。
○ Day1~Day3:オンラインでの一般発表
DEIM2023から開催されたマルチトラック制。DEIM2024でも以下の5トラックに分けて開催いたしました。
Track 1: 自然言語処理・機械学習基礎
Track 2: ビッグデータ基盤技術・データセキュリティ・プライバシ
Track 3: 情報検索・情報推薦・ソーシャルメディア
Track 4: メディア処理・HCI・人間中心情報マネジメント
Track 5: 高度なデータ利活用・ドメイン応用(医療情報,教育,地理情報等)
各トラック並列で2トラックずつ開催し、3日間各トラックで15?21セッションの一般発表が開催されました。また各スポンサー企業からも17件の技術報告発表もありました。発表数が大変多く10セッション並列で開催するため、興味のある発表が並列セッションで発表されると対面発表では移動が大変でしたが、オンライン開催だとセッション移動がしやすい利点があります。私の場合は研究室でDEIMに参加している学生たちと同時視聴し、セッションを聴きつつ補足や議論などをしていました。オンライン開催も慣れてきていろんな楽しみ方ができて良いですね。
○ Day4:チュートリアル・ネットワーキング
3日間の一般発表のあと土日を挟んで会場(アクリエひめじ)に集合しました。4日目の午前と午後最初のセッションはチュートリアル。DEIM2022からチュートリアルセッションが再開されましたが、超人気・有料コンテンツとして注目されています。DEIM2024ではLLM関連の4件のチュートリアル(基礎理論と研究動向,実践,ハルシネーション, LLMベースIR)に加え、連合学習、経済データ分析、高次元データの最近傍探索、PostgreSQL開発まで幅広いコンテンツで、どのセッションも大盛況でした。今回は特に学生グループによるチュートリアルもあり講師としての参加の幅がより広がったように思います。
オープニングでは主催協賛の皆様のご挨拶もさることながら、久々にCFP宣伝コーナーが復活したのが個人的に感慨深かったです。DEIMで発表しフィードバックを得た研究をぜひ案内のあった国際会議や論文誌への投稿につなげて欲しいと思います。ネットワーキングでは日本データベース学会学生企画「DEIMを羽ばたいた学生の今」とOpenSpaceTechnology(OST)セッションがありました。学生企画では企業研究者や起業した方々の話でも大盛り上がり、OSTは参加者同士が悩みや思いを自由に発信し合う場となりました。日本データベース学会からの軽食提供もあり、遅くまで大変盛
り上がりました。
○ Day5:インタラクティブセッション・DBSJアワー
今年度はインタラクティブ(ポスター)発表が371件と大変多く、初の展示会場によるセッション開催となりました。4日目と5日目と分けて90分のセッションを3回取りましたが、その時間では足りないくらいそれぞれ議論が白熱していたようです。また20件のスポンサーブースも大変盛況でした。DBSJアワーの受賞者講演もオンサイトでは実に6年ぶりでした。今もなお第一線でイキイキと研究を進めていらっしゃる北川先生と清木先生のお話が聞け大変刺激を受けました。
○ おわりに
対面での活動が増えたことに加えLLMの台頭と普及でデータ工学分野にとっては激動の1年だったことを反映したのか、とても刺激的で活発な議論が多いDEIM2024でした。個人的には直列ハイブリッド形式は、発表・情報収集のオンライン開催、交流・対話・議論のオンサイト開催とメリハリがあってとても気に入っています。皆様は参加してみていかがだったでしょうか。また来年DEIM2025で皆様、そして新しいワクワクする研究に出会えることを楽しみにしています。
著者紹介:
渡辺 知恵美(筑波技術大学)
2003年お茶の水女子大学大学院博士後期課程修了. 博士(理学). 奈良女子大学助手,お茶の水女子大学講師, 産業技術大学院大学准教授, 筑波大学准教授を経たのち2019年より現職にて個人情報保護技術, 教育データ分析,インクルーシブデザイン, アジャイルPBLに関する研究及び教育に携わる. 日本データベース学会理事,アジャイルPBL振興会理事.
2.AAAI2024 参加報告
赤木 康紀(日本電信電話株式会社)
2024/2/20-2024/2/27の日程で,人工知能分野のトップカンファレンスであるAAAI2024 (The 38th Annual AAAI Conference on Artificial Intelligence) が開催されました.私は採択された論文の発表のため現地参加しましたので、参加報告をさせていただきます.
今年はメイントラックには12100件の論文が投稿され,9863件が査読され,2343件が採択されました(採択率23.75%).その中で選ばれた120件について口頭発表が行われ,全ての論文についてポスター発表が行われました.さらに,Outstanding Paper Awardsが3件の論文に対して授与されました.採択された論文の分野はコンピュータビジョンが最も多く,機械学習,自然言語処理と続いており,AI分野の幅広い論文が投稿されていることが見て取れます.レビューに関する昨年からの変更点として,レビューにおける回答項目及び数値指標を減らし定性的な評価に重点を置くようにしたこと,主観性を排除するための指標を追加したこと,予め採択率を決めず基準を超えた論文はほとんど全て採択する方針に変更したことなどがあるとのことです.
日程は2/20-21がチュートリアル,2/22-25が本会議,2/26-27がワークショップとなっていました.本会議ではメイントラックの口頭発表セッションとともに,10件程度の招待講演,3日間にわたるポスター・デモセッションなどが行われました.口頭発表セッションは会議の規模の割にはパラレル数が少なく,自身の見たい発表を多く見られるようなプログラムになっていました.ポスターセッションでは論文の件数が多いこともあってか会場にたくさんの人が集まり,白熱した議論が交わされていました.AAAIはAIに関連していればどんな論文でも受け入れる雰囲気があるため,ポスターセッションには多種多様なジャンルの発表が集まり,自分が全く知らない分野を発見することがあります.ポスターセッションに割り当てられた時間が各日2時間程度しかないため全てを見ることは難しいですが,ふらふらと気になるポスターを探すだけでもとても楽しく有意義な時間になりました.
ここでは私の印象に残った講演である,Harvard University の Milind Tambe氏による”ML+Optimization: Driving Social Impact in Public Health and Conservation” について簡単にご紹介します.Tambe 氏は機械学習及び数理最適化技術を実社会で活用しインパクトを与える研究を長年行ってきました.これらの技術の活用範囲は公衆衛生から環境保全,セキュリティと多岐にわたります.Tambe 氏の仕事において注目すべきは,理論貢献と実応用での貢献が非常に高いレベルで融合している点です.Restless bandit, dicision-focused learning, influence maximization などの理論に裏打ちされた手法を,インドにおける母子健康プログラムやロサンゼルスにおける HIV 予防,カンボジア・ウガンダ・ベリーズにおける環境保全活動などの実フィールドに適用し,その有効性を確認したプロジェクトが多数紹介されました.このような研究は,理論ばかりができあがり実応用に結び付けられないものや,理論に裏打ちされない単なる応用事例にとどまってしまうことも多いと思います.理論と実応用の両輪を世界規模で進める Tambe 氏の研究には,見習わなければならない部分が非常に多いと感じました.
今回、私が投稿した論文としては “Analytically Tractable Models for Decision Making under Present Bias”, “Optimal Transport with Cyclic Symmetry” の2件が採択されました.前者は口頭発表に選出されていたため,2/25 の “Machine Learning & Application” セッションで口頭発表を行い,さらに2件ともポスター発表を行いました.”Analytically Tractable Models for Decision Making under Present Bias” は人間の持つ現在バイアスに関する論文です.現在バイアスとは,直近の利得やコストを過大評価してしまう,人間の認知バイアスの一つであり,長期的な目標達成行動を阻害することが知られています.本研究では,現在バイアスの影響下の人間の新しい数理モデルを提案しました.提案モデルは,人間の行動を数学的に閉形式で書き表すことができるという著しい特長をもっており,その表式に基づき今までは困難だった介入の最適化問題を解くことを可能にしています.”Optimal Transport with Cyclic Symmetry” は最適輸送に関する論文です.最適輸送とは,与えられた確率分布を別の確率分布に最小コストで輸送する方法を求める問題であり,機械学習やメディア処理に幅広い応用を持ちます.本研究では,入力に潜む巡回対称性を利用して最適輸送問題を高速に解く手法を提案しました.いずれの発表もポスター発表が盛況で,様々な有用な意見を頂くことができました.
AAAI2025はアメリカのフィラデルフィアで2025/2/27-2025/3/2の日程で開催されます.AAAIは様々な論文が集まることからAI分野全体を俯瞰するのに適した会議であり,参加する価値は非常に高いと感じました.ポスター会場の盛り上がりも必見ですので,ぜひとも現地参加を検討してみて下さい.
著者紹介:
赤木 康紀(日本電信電話株式会社)
日本電信電話株式会社 人間情報研究所 研究主任.2016年に東京大学大学院情報理工学科数理情報学専攻修士課程を修了.同年,日本電信電話株式会社に入社.2023年に社会人博士として筑波大学大学院理工情報生命学術院システム情報工学研究群情報理工学位プログラム博士後期課程を修了.数理最適化,数理モデリング,行動モデリング,データマイニングの研究に従事.
3.IEEE BigComp2024 参加報告
莊司 慶行 (静岡大学)
【会議の概要】
2024年2月18日から21日かけてタイのバンコクで開催されたIEEE BigComp 2024に参加し、発表を行ってきましたので、報告いたします。 BigCompは正式名称を「2024 International Conference on Big Data and Smart Computing」といい、大規模データを利活用した幅広い情報系トピックを取り扱う国際会議です。主に、DB、ネットワーク、AI系の研究者が運営しています。DEIMやWebDBで発表される論文のほとんどは、スコープ内だと思われます。IEEEと、KIISE(韓国の情報系の有名学会)が共同開催しており、運営にはDBコミュニティでよくお名前を耳にする韓国の先生方が多く参加されています。2019年にはDBSJ協力のもと京都で開催されたこともあり、なじみ深い会議です。会議の規模としては、参加者が180名くらいで、発表会場も最大3並列と、大変賑わっていました。6個のワークショップも併設されるなど、なかなかの規模だと思います。会議の難易度としては、フルペーパーでの採録が126件中41件(32.5%)と、結構頑張って書かないと通らない採択率になってきています。今年、採録件数が最も多かったのは韓国の25件で、次いで日本と中国から7件ずつの採録がありました。日本からの投稿数は11件とのことでした。アジアのDB系応用分野で日本の存在感を示すためにも、もっと積極的に投稿するとよいかもしれません。運営上の心遣いとして、新型コロナ規制の緩和に伴い、参加者間のネットワーキングに力を入れたとのことでした。毎日のコーヒーブレイクやランチに加えて、クルージング船でのウェルカムレセプション、会場直結のバンケットなど、参加者間で十分に交流が取れるように配慮されていました。
【会場の様子】
今年の会場はバンコクのパヤータイ地区の、高級ホテル内での開催でした。会場は快適で、空港からのアクセスや周辺での買い物のしやすさなども含めて、とても過ごしやすい環境でした。開催地区の雰囲気として、現在のバンコクの急激な発展速度は凄まじいものがあり、近未来的な感じと東南アジアらしさが入り混じっていて、ちぐはぐでサイバーパンクな印象を受けました。会場から少し歩くと大規模ショッピングモールを床面積そのままに縦に伸ばしたような超巨大商業施設が乱立しているエリアがあり、きらびやかなビルの中には海外の有名ブランド店がひしめいています。かと思えば、一歩外に出ると、それらを結ぶ細かな路地に、自転車で屋台を引いている人がいたり、地べたで露店を広げて果物などを売り買いしている光景も見られました。
【学会のテーマ】
今回の学会のトピックとして、大規模データ基盤やマイニングアルゴリズムなどの従来のデータ工学的なトピックに次いで、生成系AIを用いた研究に関するセッションが多く見られました。生成系AIそのもののセッションもありましたが、画像やNLPに生成AIを使った研究や、Human-Centered AIに関するセッションもありました。3件のキーノートもDeepLearningに関係するものが多く、超大規模データをいかに現代のAI研究に利用可能にしていくかという課題に、データインフラや環境の面から切り込んでいく内容のものがありました。人間のためでなく、AIのためにDB技術を研究する時代が、いよいよやってきたのかもしれません。ベストペーパーは北京航空航天大学のYuan Renさんらによる研究で、質問応答データセットにおけるマルチタスク学習に関する研究でした。
【投稿上のアドバイス】
今年のBigCompでは、幸運にも私の共著論文が3件採録されており、うち2件について自分で発表してきました。両方とも大規模言語モデルをうまくファインチューニングして情報検索・情報アクセスの課題に利用する内容で、理論ではなくアプリケーション寄りの研究です。具体的には、BERTを使ってレビューから映画を検索可能にしたり、GPT-2を使って商品説明から分かりやすい体験的記述を生成する研究でした。これらは応用的でややビッグデータ的ではないテーマでしたが、査読は鋭い指摘もありつつ肯定的で、会場の質疑でも建設的なコメントをたくさん頂けました。このように、この学会では、応用的な事例や工学的な論文でも比較的採録されやすい印象があります。少しトピックからずれているように感じても、恐れずに投稿してみるとよいと思います。来年度の開催地はマレーシアのコタキナバル、2月9日から開催予定とのことです。全体的に、アイデアがはっきりしていて、なおかつ論文がよく書けていれば、評価実験がそこまで大規模でなくても採録される傾向を感じています。対象となる研究テーマの幅も広いので、手ごろな中堅国際会議だと思います。また、学部生や修士学生でも、十分に採録される可能性がある会議です。例年、締め切りが11月頃ですので、ブラッシュアップした卒業論文や、提出直前の修士論文を投稿してみるのもいいかもしれません。積極的なご投稿を検討いただければと思います。
著者紹介:
莊司 慶行(静岡大学)
2015年京都大学大学院情報学研究科社会情報学専攻博士後期課程修了。博士(情報学)。京都大学、首都大学東京、青山学院大学での勤務を経て、2023年より静岡大学情報学部行動情報学科講師。情報アクセス技術やソーシャルコンピューティング分野において、投稿データを活用したウェブ検索アプリケーションや記憶に残る情報提示法などの研究に従事。
4.EMNLP2023 参加報告
宮野 稜大(大阪大学)
2023年12月6日から12月10日にかけてEMNLP2023(Empirical Methods in Natural Language Processing)がシンガポールで行われました.EMNLPは自然言語処理分野のトップカンファレンスです.私はワークショップを含む全日程で会議に現地参加しました.今回が初めての国際会議への参加でしたが,有意義な時間を過ごすことができました.今年の投稿数は4,909件と過去最多で,昨年と比較し700件以上増加しています.メインカンファレンスの採択率は21.3%(Long Paper 22%, Short Paper 12%)で,Findingsと合わせた採択率は42.9%(Long Paper 45.4%, Short Paper 33.5%)でした.トラックごとの投稿数では,応用研究(NLP Applications)が最多で,大規模言語モデル(Theme Track: LLMs and Future of NLP)が次点でした.EMNLP2023は現地とオンラインのハイブリッド形式で開催されました.今年は多くの方が現地参加していましたが,現地参加が難しい場合はオンラインで発表することが可能でした.また,オンライン参加者もUnderline上で事前に録画された発表内容を確認できるようになっていました.
私はメインカンファレンス初日に「Self-Ensemble of N-best Generation Hypotheses by Lexically Constrained Decoding」というタイトルでポスター発表を行いました.本論文では,言語生成モデルの出力文の品質を改善する手法を提案しています.言語生成では複数の出力候補を生成し,その内最もスコアの高い候補を出力することが一般的ですが,各候補には良い箇所と悪い箇所が混在しています.そこで,本研究では各候補の良い箇所を統合することで高品質な出力を生成することを目指しました.各候補の品質を推定して高品質な表現を収集し,収集した表現を含むように制御しながら再度生成を行うことで,高品質な出力文を生成する手法を提案しました.ポスターセッションは盛況で,90分間のセッションと休憩時間で20名以上の方と議論を行うことが出来ました.多くの質問とフィードバックをもらうことができ,大変有意義な経験をすることができました.
次回のEMNLP2024は,アメリカのマイアミで11月12日から11月16日の日程で開催予定です.最近は大規模言語モデルを中心に自然言語処理の研究が盛んであるため,次回のEMNLPも盛況が予想されます.ご興味ある方は参加を検討されてみてはいかがでしょうか.
著者紹介:
宮野 稜大(大阪大学)
大阪大学大学院情報科学研究科修士1年.言語生成に関する研究に従事.現在は大規模言語モデルのドメイン適応に関する研究に取り組んでいる.
過去のNewsletterはこちらです。