日本データベース学会

dbjapanメーリングリストアーカイブ(2014年)

[dbjapan] DBSJ Newsletter Vol. 7, No. 3: ICDE2014, WWW2014



┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
┃ 日本データベース学会 Newsletter
┃ 2014年6月号 ( Vol. 7, No. 3 )
┗━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

薫風さわやかな季節もつかの間,早くも西の方からは梅雨入りの知らせが届く季
節となりました.会員の皆様におかれては益々ご活躍のことと存じます.

本号では,データベース・データ工学およびWebの分野における最重要国際会議
「ICDE2014」「WWW2014」に参加された若手研究者3名に,注目トピックの動向
ならびに所感を語っていただきました.より多くの皆様にとって世界での活躍に
つながるよい刺激になれば幸いです.

本号ならびにDBSJ Newsletterに対するご意見あるいは次号以降に期待する内容
についてのご意見がございましたらnews-com [at] dbsj.org までお寄せください.

                                日本データベース学会 電子広報編集委員会

=======================================================================

----
目次
----

1. ICDE 2014に参加して
    白川 真澄  大阪大学 大学院情報科学研究科

2. WWW 2014に参加して
    秋葉 拓哉  東京大学 情報理工学系研究科 今井研究室

3. WWW 2014に参加して(主に情報検索研究の観点から)
    加藤 誠  京都大学 情報学研究科

=======================================================================

■1■ ICDE 2014に参加して            白川 真澄 (大阪大学 特任助教)

SIGMODやVLDBと並んでデータベース系の三大会議とされる国際会議ICDE
2014(2014年4月1〜3日,シカゴ)に参加してきました.シカゴはニューヨーク,
ロサンゼルスに次いで全米第三位の人口を持つ都市で,ジャズやブルースをはじ
め,クラブミュージックなど,音楽の発信地として有名です.シカゴの治安は思
いのほか良く(一部地域を除く),滞在中は全くトラブルもなく過ごせました.

ICDEはデータベース系の会議と書きましたが,正確にはInternational
Conference on Data Engineeringという名前のとおり「データ工学」に関する会
議で,データベースコア技術に関する研究以外にも,グラフマイニングやテキス
トマイニング,ソーシャルコンピューティング,クラウドソーシングなど,幅広
く対象としています.Twitterマイニングの研究とかもあるので,国内ワーク
ショップのDEIMと分野的にはほとんど一致するのではないかと思います(DEIMと
比べるとデータベースコア技術の研究がかなり多いですが).最近はあまり見か
けませんが,昔はセンサネットワークの研究などもあり,今年のICDE
Influential Paper AwardsはICDE 2004に発表されたセンサネットワーク上での
データ収集に関する論文でした.センサネットワークでは通常,各センサが自分
の近くにいるセンサしか認識できない状況で,自律分散的にデータを収集したり
中継したりしないといけないのですが,このような問題を解決するための技術
が,今流行りの分散処理の技術として受け継がれていたりするので,幅広いなが
らも技術的にオーバーラップしている部分も多いのだと思います.

ICDEのメインストリームであるデータベースコア技術についてですが,今年は
(今年も?)分散処理やメインメモリデータベースなど,ビッグデータに立ち向か
うための技術に関する研究が盛り上がっていたように思います.Best Paperもメ
インメモリデータベースに関する研究でした.ビッグデータなのにメインメモリ
データベース?普通のデータベースよりも扱えるサイズ小さくない?と思われる
かもしれませんが,ビッグデータのための技術は「データを蓄える」よりも
「データを高速に処理する」ことが重要です.Anastasia Ailamaki先生のキー
ノートでも関連するお話があり,もはやデータをDBMSに投入するだけでも大変な
時代が訪れようとしているので,データをDBMSに一括で投入する処理を省き,代
わりにクエリ処理をしながら以降のクエリ処理を様々な方法で高速化していく
NoDBと呼ばれるアプローチが模索されています.

会議はHoliday Innというホテルで開催されました.かなり並列でセッションが
組まれており,三つのリサーチセッションにパネルディスカッションとチュート
リアルまでやっているその裏でデモセッションがあったりして,しかもデモセッ
ションが隔離されたような場所でやっていたので,全くと言っていいほどデモ
セッションには人がいなかったです.並列化しすぎて興味のある発表が結構聴け
なかったのでその点は不満に思いました.また,会議中に出る昼食はあまりおい
しくなく,早く日本に帰って米を食べたくなりましたが,バンケットはシェッド
水族館を貸し切って行われ,その豪勢っぷりにメシマズのことも忘れ気分を良く
したのでした.

ICDE 2014の採択率は20.0%(89/446件)で,日本からの採択は1件のみでした.投
稿数もたぶん少なかったと思います.ICDE 2015は韓国で開催されますので,も
う少し日本からの採択数・投稿数が増えればいいなと思います.とはいっても,
そう簡単に投稿して通るものではないと私自身もRejectばかりくらって実感して
いますので,実際に難関会議に継続して通しているような人を学会等で捕まえ
て,図々しくアドバイスをもらったり,ちょっと論文を読んでもらってコメント
をお願いしたりすればいいのではないかと思います.忙しくて断られることもあ
るかもしれませんが,少なくとも,そのようなやる気のある人にイヤな顔をする
研究者はいません.

最後にちょこっと宣伝ですが,6月14日(土)のACM SIGMOD日本支部講演会でも
ICDE 2014の参加報告をさせていただく予定ですので,この記事を読んでちょっ
とでも面白いなと思った方はぜひお越しください.より詳細な内容についてお話
しする予定です.

(白川 真澄  大阪大学 大学院情報科学研究科 特任助教)

--------------------------------------------------------------------

■2■ WWW 2014に参加して         秋葉 拓哉 (東京大学 博士後期課程)

2014 年 4 月 7 日から 11 日にかけて開催された WWW 2014 についてご報告い
たします.WWW はウェブ分野の国際学会で,今年で 23 回目の開催です.最初の
2 日間はワークショップとチュートリアルで,会議本体は 4 月 9 日から開始と
いう形でした.開催地はソウルの COEX と呼ばれる大規模なコンベンションセン
ターでした.韓国の方から聞いたことによると,COEX は韓国内で大変有名な場
所だそうです.学会が公式で Flickr に写真をアップロードしていますので,会
場の様子はそちらからご覧になれます
(https://www.flickr.com/photos/121999139@N03/).

全体的としては,WWW は本当に幅広い話題を扱う学会だなという認識を改めて持
ちました.そして,単純に話題の幅が広いだけではなく,多様な価値観を認めて
いると感じる点が興味深かったです.すぐに役立つような手法の提案も大変多く
それらも興味深いのですが,一方で,実験的あるいは理論的な解析結果をメイン
とする研究が複数ありました.特に,中には理論的なモデルの定義や数学的議論
がメインとなっており実験はほんのおまけ程度というような論文もあり,実用性
の高い論文が数多く投稿されている中でそういった論文にも価値が認められる文
化なのだということが印象に残りました.

キーノートの中では,自分がネットワークに関連した研究をしていることもあ
り,Christos Faloutsos 先生が印象に残っています.内容自体は,彼がこれま
でにやってきた研究を 1 つ 1 つ矢継ぎ早に紹介するというような形に近かった
のですが,そのようなネットワークに関する話がこの大人数の前でキーノートと
して行われるのだということが,ネットワークに関連する研究をする人間の一人
として嬉しかったように思います.(WWW 2013 でもネットワークに関する研究で
有名な Jon Kleinberg 先生がキーノートをしていますね.)

また,個人的にとても面白いと思ったのは Web Science Track におけるTwitter
社のグループによる発表です.この発表では Twitter のフォロー・フォロワー
ネットワークの解析結果が示されており,一部の日本人ユーザが原因で通常の
ネットワークが持つ典型的な性質が壊れているということが紹介されました.
Twitter のヘビーユーザーが日本に大変多く存在し,お互いに密につながり合っ
ていることが原因のようです.ちなみに,この件について Twitter でツイート
してみた所,日本の多くの方に面白がってもらえた様子で,そのツイートは 350
回ほどリツイートされました.WWW 2014 ではリツイートのようなネットワーク
上の情報拡散に関する研究も複数件あり,それらの発表を聞いた夜に自身がカス
ケードの起点となるのはとても面白い気分で,また良い復習になりました.

私の WWW 2014 での発表は,大規模ネットワークにおける最短経路の計算を高速
化するための索引を,時間変化するネットワークに向けて拡張し,今までの手法
では実現できなかったような新たないくつかの機能を効率的に実現するというも
のでした.このようなグラフに対する索引の手法は,どちらかというと,通常
SIGMOD や VLDB をはじめとするデータベースのコミュニティでよく研究されて
きた話題です.本研究も,実は WWW に採択される前には VLDB に提出していた
のですが,残念ながら採択には至りませんでした.この理由としては,当時のプ
レゼンテーションに難があったことも確かではあるのですが,それらの学会の,
手法の新鮮さを重視するという価値観が厳しかったように思います.本研究は
SIGMOD 2013 で発表した手法をベースとしており,査読ではインクリメンタルな
研究だという批判が少なくありませんでした.そこで今回は「何が実現できる
か」に重点を置いたプレゼンテーションに切り替え WWW に提出してみるという
方向に大きく舵を切りました.それまで殆どデータベースの学会にしか投稿した
ことがなかったため,結果を予想するのは大変難しかったのですが,この判断は
どうやら功を奏し,論文は採択につながりました.研究の強みを理解してもらい
やすそうなコミュニティを投稿先として選ぶということは,時として重要かもし
れません.日本からの Research Track Full Paper の発表はこの 1 件でした
が,ポスターや Web Science Track では他にも日本からのグループの方の発表
が複数ありました.

来年 2015 年の WWW はイタリアのフィレンツェで行われるとのことです.皆様
ぜひ参加を目指されてみてはいかがでしょうか.

(秋葉 拓哉  東京大学 情報理工学系研究科 今井研究室 博士後期課程2年)

--------------------------------------------------------------------

■3■ WWW 2014に参加して(主に情報検索研究の観点から)
                                        加藤 誠 (京都大学 特定助教)

2014年4月7日から11日にかけて韓国・ソウルで開催されたWWW2014に参加しまし
た.私は9日からの参加でしたので,主に本会議と自身のポスター発表の報告と
なります.また,その中でも情報検索に関するセッションを主にご紹介したいと
思います.

本会議ではデータベース,情報検索,データマイニング系のセッションに参加し
ましたが,WWW2014全体の印象としては,ソーシャルネットワーク大流行といっ
た感じで,セッション数としてもおそらく最多の4セッションでした.外野から
見た印象としては,ソーシャルネットワーク→グラフによるモデル化→大規模グ
ラフ問題,という流れが多く,本会議最初のキーノートがProf. Christos
Faloutsos(CMU)による「Large Graph Mining」であったことも頷けました.

情報検索に関連するセッションから3つの発表を,その関連研究の動向を踏まえ
て紹介させていただきます.

・Composite Retrieval of Heterogeneous Web Search (Web Search 1)
  Horatiu Bota, Ke Zhou, Joemon M. Jose and Mounia Lalmas
  英国Glasgow大学の発表で,vertical searchからaggregated search,そし
  て,その次はこの発表で提案しているcomposite searchが位置づけられるとい
  う主張を持った内容でした.Vertical searchとは,ある特定の種類のコレク
  ションからの検索で,例として商品検索やニュース検索などが挙げられます.
  Aggregated searchとは現在Web検索エンジンでも主流になっている検索方法
  で,異なる種類のコレクションからそれぞれ検索を行いその結果を織り交ぜて
  提示する検索方法です.例えば,今のGoogleなどの検索結果を見ていただく
  と,文書,画像,ニュースなどが検索結果の中に含まれていることがわかると
  思います.この発表で著者らが提唱するcomposite searchは,この延長線上に
  ある研究で,bundleという文書,画像,動画を一つにまとめたものを検索結果
  として提示するという,コンセプトを主眼に置いた大変WWWらしい内容でした.

・Contextual and Dimensional Relevance Judgments or Reusable SERP-Level
  Evaluation (Web Search 1)
 Peter B. Golbus, Imed Zitouni, Jin Young Kim, Ahmed Hassan and
  Fernando Diaz
  検索システムの評価は情報検索研究の中ではかなり大きな割合を占めており,
  毎年たくさんの提案があります.その中でも特に目立つ流れとして,文書の適
  合性を個々に評価するのではなく,検索結果ページ(Search Engine Result
  Page, SERP)全体の良さ(utility)を評価すべきだ,という考え方があります.
  この考え方には主に2つの源流が存在すると考えており,1つはwhole-page
  relevanceという考えを提唱したMicrosoftのEvaluating Whole-Page
  Relevance [Bailey+, SIGIR'09],そして,Expected Reciprocal Rank (ERR)
  を提案したYahoo! LabsのExpected Reciprocal Rank for Graded Relevance
  [Chapelle+, CIKM'09]ではないかと思います.さて,本発表では前述の2つの
  研究とは著者が異なりますが,Microsoftと元Yahoo! Research現Microsoftの
  Fernando Diazとの共著であり,2つの研究を発展させたような内容になってい
  ます.具体的には,1) SERP中で閲覧した検索結果が,ユーザが現在見ている
  検索結果の良さに影響を与えることを前提とした適合性判定方法contextual
  relevance judgmentsを提案しその現実的な実装方法を提案,2) SERP全体の良
  さを,各検索結果へのdimensional relevance judgments (ページのトピック
  適合性,authority,freshness,質などの評価)とcontextual relevance
  judgmentsから推定する,再利用性の高い評価方法を提案,をしています.

・From Devices to People: Attribution of Search Activity in Multi-User
  Settings (User Behavior)
  Ryen W. White, Ahmed Hassan, Adish Singla and Eric Horvitz
  こちらもMicrosoftの論文で,SIGIRにおいて7年間で3つのbest paper awardを
  すべて筆頭著者として受賞している,exploratory searchやuser behavior分
  析で有名なRyen W. Whiteの論文です.検索ログを分析する際には,どのPCか
  らアクセスされているかはわかりますが,そのPCが複数人で共有されている場
  合,その中の誰がどの検索を行っているかは容易にはわかりません.検索ログ
  からユーザの行動を分析する際には,このことがネックとなるため,本論文で
  は同一PCからのアクセスがどの人によるものなのかを推定する方法を提案して
  います.Bingの検索ログを用いた検索行動分析を多数行ってきた研究者ならで
  はのモチベーションではないか思います.基本的な手法は様々な特徴量をMART
  で学習するというもので,彼らの研究ではよく見られる方法です.特に興味深
  い知見としては,1) 何人のユーザで1台のPCを共有しているかを推定するため
  には検索結果中でクリックされるページのトピックエントロピーおよび
  reading level,子供向けのクエリの割合が特に重要である,2) どの検索行動
  が同一のユーザであるかを判定するためには,検索した時間の差,利用したク
  エリの出現頻度(全ユーザの使用回数)の差,1セッションにかけた時間の差,
  などが特に重要である,というものでした.

 最後に私が発表したポスターについて紹介して終わりたいと思います.

・Cognitive Search Intents Hidden Behind Queries: A User Study on Query
  Formulations
  Makoto P. Kato, Takehiro Yamamoto, Hiroaki Ohshima, Katsumi Tanaka
  非常にシンプルなユーザスタディで,認知的検索意図(cognitive search
  intent)がクエリとしてどのように現れるか,という疑問について調べた研究
  です.認知的検索意図とは得られる文書の認知的特性(わかりやすい,主観的/
  客観的,具体的/抽象的など)に対する要求で,例えば「『わかりやすい』ブ
  ラックホールについての文書が欲しい」,「Appleの新製品に関する『主観的
  な』文書が欲しい」などといった検索意図が挙げられます.400人近くのユー
  ザにクエリを入力してもらったところ,タイトルが示すとおりの結果が得られ
  ました.ほぼ半数のユーザは認知的検索意図に従ってクエリ入力することが求
  められているにも関わらず(また,求められていることを理解しているにも関
  わらず),クエリには認知的検索意図に関わる言葉を使いませんでした.この
  ことは,クエリログによる検索意図推定の限界と,ユーザの認知的検索意図が
  見落とされている可能性を示唆しています.この研究の続きはSIGIR2014にて
  full paperで採択されているので,もし興味があればauthors' version (
  http://goo.gl/1LSFsL ) をご覧ください.

(加藤 誠  京都大学 情報学研究科 特定助教)

=======================================================================