日本データベース学会

日本データベース学会 Newsletter 2023年12月号 (Vol.16, No. 7)

目次

    1. ACM RecSys 2023 参加報告
      冨田 燿志(株式会社サイバーエージェント)
    2. ACM CIKM 2023 参加報告
      山口 晃広(東芝研究開発センター)
    3. ACM Multimedia 2023 参加報告
      諸戸 祐哉(北海道大学)

    冬晴れが心地よい師走の候,皆様におかれましてはお気軽にお過ごしでお願いします。ますますご多忙の時期に恐れ入りますが、お身体にお気をつけて良き新年をお迎えください。よろしくお願いします。

    さて,本号では,9月に開催されました,推薦システム分野における世界のトップカンファレンス「ACM RecSys」をはじめ,10月に開催されました,情報検索,,データベースナレッジマネジメントやマルチメディア分野での最重要国際会議「ACM CIKM」と「ACM Multimedia」についてご寄稿いただきました。それぞれの会議の特徴や最近の傾向、トップカンファレンスへの投稿の利点、論文に進むまでの工夫など、皆様ご参考になれば幸いです。

    本号と DBSJ Newsletter に対するご意見あるいは次号以降に期待する内容についてのご意見がございましたらnews-com [at] dbsj.orgまでお寄せください。

    DBSJ Newsletter 編集委員会(担当編集委員 王 元元)


    1.ACM RecSys 2023 参加報告

    冨田 燿志(株式会社サイバーエージェント)

     RecSys 2023 (17th ACM Conference on Recommender Systems) が2023年9月18日から22日まで,シンガポールにて開催されました.RecSysは推薦システム分野のトップカンファレンスです.今回私は採択された共著論文の発表のため現地参加しましたので,その参加報告をさせていただきます.

     今回のResearch Paperの投稿状況は,Full Paperが投稿269本中採択 47本(採択率17.47%),Short Paperが投稿214本中採択48本(採択率22.43%)でした.投稿数は年々増えているようで,昨年の参加時はメインカンファレンスの発表セッションはシングルトラックでしたが,今年は 2トラックのパラレルセッションとなっていました.インダストリートークのトラックもあり,今年は14件の口頭発表と16件のポスター発表がありました.参加者数は997人(うち72.63%が現地参加)で,アカデミアが37.37%に対しインダストリーが62.63%と,インダストリーからの参加者割合が非常に多くなっています.また,日本からの参加者は58人で米国・中国に次いで 3位となっており,日本での推薦システムへの関心の高さが感じられます.現地でも日本のアカデミア・インダストリー双方からの多くの参加者にお会いでき,交流することができました.

     学会期間 5日間のうち,最初 2日間がチュートリアル・ワークショップ,あとの3日間がメインカンファレンスでした.チュートリアルでは「Tutorial on Large Language Models for Recommendation」のセッションが非常に聴講者が多く盛況で,メインカンファレンスにおいても LLM関連の発表が多数あったこともあり,やはり推薦システム分野においても LLMの波を感じました.メインカンファレンスでの基調講演は,Jaime Teevan氏(Microsoft),Tat-Seng Chua氏(National University of Singapore),Rajeev Rastogi 氏(Amazon)の三講演があり,特に Amazon における推薦システムの変遷と課題・アプローチと今後の展望について議論した 3件目の講演は,インダストリーで推薦システムの研究に携わっている身として非常に興味深いものでした.また,メインカンファレンスでの発表はLLMの他では,協調フィルタリングや逐次推薦(Sequential Recommendation)に関する発表が昨年に続き多くありました.

    私はメインカンファレンス初日のApplicationのセッションにおいて,Full Paper として採択された「Fast and Examination-agnostic Reciprocal Recommendation in Matching Markets」の発表を行いました.こちらは同僚の富樫陸氏,橋爪友莉子氏,大坂直人氏との共著で,求人情報サービスやオンラインデーティングサービスなどのマッチングサービスにおける相互推薦に関する研究です.広く実用されている相互推薦手法では,人気ユーザに被推薦機会が集中してしまう課題が指摘されています.私たちはこの課題に対し,経済学分野において労働市場・結婚市場の分析のために用いられる「TUマッチングモデル」と呼ばれるモデルを相互推薦に応用しました.発表時には多数の質問をいただくことができ,今後の研究につながる貴重な議論ができました.

     来年の RecSys 2024は,イタリア・バーリで開かれます.推薦システムの応用に関する研究は多数ありましたが,インダストリーからは世界的なビッグテックによる発表が多かった印象です.日本にも高い技術力を持ち推薦システムの開発を行っている企業は多数ありますが,そのような企業からRecSysへの投稿が増えれば推薦システム分野における日本の存在感はより増すように感じました.来年は日本からの投稿が増えることを期待するとともに,私たちも来年また発表できるよう,今後も研究を続けていきたいと思います.

    著者紹介:
    冨田 燿志(株式会社サイバーエージェント)

    tomita
    サイバーエージェントAI Lab経済学社会実装チームリサーチサイエンティスト.2018年東京大学経済学部卒業(経済学部卒業生総代),2019年東京大学大学院経済学研究科修士課程修了(経済学研究科修了生総代),2020年サイバーエージェント入社.マッチング理論,マーケットデザイン,ゲーム理論の研究と社会実装に取り組んでいます.

    2.ACM CIKM 2023 参加報告

    山口 晃広(東芝研究開発センター)

     2023年10月21日から10月25日にかけて The 32nd ACM International Conference on Information and Knowledge Management (CIKM 2023) が開催されました.私はpre-conference後の3日間で開催された本会議に現地参加しました.CIKM はデータマイニング, 情報検索,データベースに関する研究を扱う重要な国際会議の一つです. Full Paperは投稿数1,472に対して採択数354(採択率24%), Short Paperは投稿数554に対して採択数152(採択率27%),Applied Research Paperは投稿数254に対して採択数75(採択率32%),Demo Paperは投稿数74に対して採択数26(採択率35%), Resource Paperは投稿数81に対して採択数22(採択率27%)でした.これら全体の投稿数は2,435件であり去年の投稿数2,257件と比べても緩やかに増加しています.

     今年は基本的には現地参加となりましたが,現地参加できない方のために本会議終了後に興味のある発表をオンラインで聴講し議論する機会も設けられました.また,現地参加が難しい場合はオンラインで発表されていました.セッション全体を見渡すと,推薦が最も多く次いでシーケンスモデルやグラフ学習が多いようでした.一方,データベースシステムに関する研究は少なかった印象です.シーケンスモデルのセッションでは,私が主に研究対象としている時系列データのクラス分類や異常検知のような問題に加えて,従来では静的に扱うことが多かったグラフや表データ(の一部)あるいはバンディットアルゴリズムなどに対して,時間経過によりデータの傾向が動的に変化する場合を考慮する研究が目に留まりました.一方,交通など人々の活動を時空間上で予測する研究については別のセッションで発表されていました.

     私はFull Paperトラックにおいてシーケンスモデルのセッションで「Time-series Shapelets with Learnable Lengths」というタイトルで発表しました.ここで,shapelets とはターゲットとなるクラスの時系列データに類似しその他のクラスの時系列データから逸脱するという性質を持つ複数の局所波形パターンです.従来技術では各shapeletの長さをハイパーパラメータとして固定していたのに対して,提案技術では各shapeletの長さを shapeletsの形状と一緒に連続最適化の中で学習します.また,この長さの学習が shapeletsに期待される性質を強調するように学習されることを理論的に保証し,実験的にも分類性能や合計学習時間などで有効性を確認しました.

     その他,近い分野で主要な成果を出されている研究者が発表のために来られており対面でお話できたことも現地参加して良かったことの一つです.また,中国本土からの発表が多く日本のプレゼンスを高めていきたいと感じました.今後も,本分野の発展に貢献していきたいです.

    著者紹介:
    山口 晃広(東芝研究開発センター)
     2006年に神戸大学大学院自然科学研究科数学専攻修士課程を修了.同年,株式会社東芝に入社.2011年から2015年まで名古屋大学に出向.社会人博士として2018年名古屋大学大学院情報科学研究科情報システム学専攻博士後期課程を修了.博士(情報科学).2016年から現在まで東芝研究開発センター 知能化システム研究所 システムAIラボラトリーで主にインフラ・製造分野を応用先として時系列データを用いた機械学習・データマイニングの研究に従事.


    3.ACM Multimedia 2023 参加報告

    諸戸 祐哉(北海道大学)

     2023年10月29日から11月2日にかけて催されたThe ACM International Conference on Multimedia 2023 (ACM Multimedia 2023)に参加してきましたので,その報告をさせていただきます.

     ACM Multimedia はマルチメディア分野におけるトップカンファレンスの1つであり,マルチメディアデータの解析・応用に加えて,人工知能,メタバース,視覚と自然言語,ヒューマンコンピュータインタラクション等の幅広い研究を扱っています.本会議となる Main Track に加えて,Brave New Ideas,Open Source, Doctoral Symposium, Technical Demos, Grand Challenges と題された Trackが用意され,いくつかの発表がありました.さらに,感情分析に関するワークショップ(The 4th International Multimodal Sentiment Analysis Challenge and Workshop: MuSe 2023)やユーザ中心の動画要約に関するワークショップ(The 2nd Workshop on User-Centric Narrative Summarization of Long Videos)を始めとした,独創的な16のワークショップが用意されていました.

     今年で第31回となるACM Multimedia 2023はカナダのオタワで開催されましたが,ビザの問題で現地参加できない方が多くいたようで,現地での発表は少数でした.開催形式としては,現地とオンラインのハイブリット開催でした.当初,オンラインでの発表は予定されていなかった様子で,現地に参加できない著者の発表では,事前に録画した動画を流す形式で発表が行われました.現地の発表形式としては,Best paper Award のセッションはオーラル発表で,それ以外の発表は2分程度のティーザー・ポスター発表でした.論文採択時にはオーラル発表とポスター発表の指定があったようですが,上述のように現地での参加者が少数であったため,このような発表形式になったとのことです.また, 10月29日と11月2日はチュートリアルとワークショップ中心の日程であり,ワークショップでの発表形式はセッション毎に異なっていました.なお,現地では感染症流行の影を見ることはなく,コロナ前と変わらない雰囲気でした.

     採択に関しては,Main Track の採択論文数は 902件,投稿数は 3,669件,Desk-reject後の投稿数は3,071件,採択率は24.6%であり,投稿数に関しては年々増加傾向にあるようです.採択された論文の割合としては,Understanding Multimedia Contentに関する論文が53%,Multimedia Systemsに関する論文が4%,Experienceに関する論文が32%,Engaging Users with Multimediaに関する論文が11%であったことが報告されており,コンテンツ理解に関する発表が半数を占めるものの,多様な論文が採択されていることが伺えます.また,近年の生成AI発展の潮流を受け,Social-good, Fairness and Transparencyに関する論文も新たに受け入れており,数多くの投稿があったようです.Best Paper AwardはKexin LiらによるCATR: Combinatorial-Dependence Audio-Queried Transformer for Audio-Visual Video Segmentation
    (URL: https://dl.acm.org/doi/abs/10.1145/3581783.3611724)でした.この論文では, Audio-visual Video Segmentationという,音に基づき画像を分割するタスクに取り組んでいます.最後に,私の発表内容について紹介させていただきます.私は,Main Trackのセッションではなく,Technical Demos に筆頭著者の論文「Personalized Content Recommender System via Non-verbal Interaction Using Face Mesh and Facial Expression」(URL: https://dl.acm.org/doi/10.1145/3581783.3612675)が採択されました.本論文では,マルチメディアコンテンツの推薦システムに対して,ユーザの顔画像解析を導入することで,ユーザにパーソナライズした推薦結果を提示可能とするシステムを発表しました.従来の推薦システムでは,ユーザの閲覧履歴やコンテンツに対する評価等のインタラクションデータを用いて推薦が行われていましたが,ユーザがインタラクトしたコンテンツ数が少ない場合に,ユーザの嗜好を取り入れた推薦が困難であるという課題が存在していました.そこで,本論文では,ウェブカメラより得られる顔画像を導入することで,コンテンツ閲覧時のユーザの反応を解析し,インタラクションが少数である場合にもユーザにパーソナライズした推薦を実現可能なシステムを構築しました.本システムはユーザの個人パソコンで動作するように設計しており,下記の URLよりアクセス可能です.
     日本語版:https://www.lmd-demo.org/2022/start.html
     英語版:https://www.lmd-demo.org/2022/start_eng.html

     本システムの構築で工夫した点としては,顔画像をサーバにアップロードせずに解析するために,深層学習モデルをエンド端末で動作するように実装した点,ウェブ公開することで誰でもシステムを体験できるようにした点があります.一方,人種・文化等の個人的な背景により表情の変化が異なるため,顔画像からユーザの反応を推定する機構の構築に苦労しました.この機構をはじめとして,本システムはいくつかの要素技術から構築されておりますが,各要素技術において改善の余地はあります.しかしながら,本論文の貢献は,多様なAI分野の技術を集積し,システムとして動作させた点にあるので,システム全体に対するアイデアや実装が評価されたと個人的には考えております.

     私たちの論文を含め,Technical Demos のセッションの採択論文では,詳細な課題が残存していたとしても,システムとしての新規性やインパクトがあれば,そこが評価されて採択につながっている印象を受けました.本セッションに論文を投稿するにあたって必要となるものは,ACMフォーマットで2ページ(+参考文献)の論文と 5分以内でシステムを紹介する動画でした.論文では,システム開発の背景や関連研究との違いを説明しつつ,システム内部の処理や新規性についての説明を行いました.論文の執筆に関しては通常の論文と同様に執筆しましたが,動画に関しては作成に慣れておらず,苦労しました.動画では,システムを実際に動かすことで査読者にインパクトを与えることを意識しましたが,どのように動画を構成して,何を見せれば良いのか,という根本的な知識が不足しており,手探りで動画を作成しました.この動画も論文のURL(https://dl.acm.org/doi/10.1145/3581783.3612675)から閲覧可能ですので,興味のある方はご覧ください.なお,ACM Multimedia 2023のTechnical Demosにおける採択論文数は19件,投稿数は40件,採択率は 47.5%でした.当日の発表では,現地参加の多くの方にお越しいただき,システムを体験していただきました.幸運にも,面白いという肯定的なご意見を多くいただくことができました.さらに,システムを構成する各要素技術について,専門とする方から鋭いご指摘やアイデアをいただくことができ,とても勉強になりました.幅広い分野の研究者が参加していることもACM Multimediaの大きな特徴であり,分野の垣根を超えた議論ができたことも良い経験でした.

     ACM Multimedia 2024 はオーストラリアのメルボルンにて開催予定で,今年度のようなビザの問題が発生しないように運営を行うとのことでした.是非投稿をご検討ください.

    著者紹介:
    諸戸 祐哉(北海道大学)
     北海道大学大学院情報科学院情報科学専攻博士後期課程 3年在籍,日本学術振興会特別研究員 DC1.2019年3月に北海道大学工学部を卒業し,2021年3月に同大学大学院情報科学院情報科学専攻修士課程を修了の後, 2021年4月より現在の所属に至る.画像・動画像等を対象としたマルチメディア信号処理,視線・脳活動等の人間の生体情報処理に関する研究に加え,それらを協調的に扱う異種データのマルチモーダル解析に関する研究に従事.


    過去のNewsletterはこちらです。