日本データベース学会

dbjapanメーリングリストアーカイブ(2018年)

[dbjapan] DBSJ Newsletter Vol. 11, No. 3: ICDE2018, DCC2018, WSDM2018


┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
┃ 日本データベース学会 Newsletter
┃ 2018年6月号 ( Vol. 11, No. 3 )
┗━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

気温が徐々に上がり,夏が近づいていることを実感する季節になりましたが,
皆様方におかれましてはますますご健勝のこととお慶び申し上げます.

さて本号では,国際会議の参加報告を4件ご寄稿いただきました.2月に開催さ
れたWSDM2018と,4月に開催されたICDE2018のご報告です.また,DB系の周辺
領域ということで,3月に開催されたDCC2018のご報告もご寄稿いただきました.

本号ならびにDBSJ Newsletterに対するご意見あるいは次号以降に期待する内
容についてのご意見がございましたらnews-com [at] dbsj.orgまでお寄せくだ
さい.

                日本データベース学会 電子広報編集委員会
                      (担当編集委員 吉田 諭史)

========================================================================

----
目次
----
1.ICDE 2018に参加して
  杉浦 健人(名古屋大学)

2.DCC 2018 参加報告
  喜田 拓也(北海道大学)  

3.WSDM2018 参加報告
  川前 徳章(NTTコムウェア/東京大学)

------------------------------------------------------------------------


■1■ ICDE 2018に参加して
                         杉浦 健人(名古屋大学)

2018年4月16日から19日にかけてフランスのパリで開催された34th IEEE
International Conference on Data Engineering(ICDE 2018)に参加いたし
ました.花の都パリでの開催ということもあり出発前から期待しておりました
が,エッフェル塔を始めとする建造物など,滞在中は思わず目を惹かれる景観
を楽しむことができました.

ICDE 2018の特色として,まず豪華な6つの基調講演が挙げられます.特に,
NVM(non-volatile memory)を取り巻く状況の過去・現在・未来について話さ
れたMargo Seltzer先生の講演と,DBMS分野全体に対する問題提起が行われた
Michael Stonebraker先生の講演は大変興味深いものでした.PCM(phase
change memory)を始めとする次世代NVMの登場により,同時実行制御やプログ
ラミングモデルなど,多くの技術が影響を受けはじめています.一方で,そう
した次世代NVMを活用したKiller Appはまだ登場しておらず,Selzer先生も次
回のICDE 2019でそれらが提案されることを期待していました.また,
Stonebraker先生は,会議の場からDBMSのコア技術が消えつつあり,それによっ
て各応用分野で共通する知識が少なくなっていること(相互理解が減りつつあ
ること)など,10個の問題提起と解決案の提言を行われました.なお,いずれ
の講演内容も論文集に掲載されている基調講演論文で詳細を確認できますので,
興味のある方は是非ご参照ください(特に,Seltzer先生の論文には92個の参
考文献が載っており,NVMに関する文献を探す上で役立つのではないかと思い
ます).

研究論文については,424件中98件がFull Paperとして採択され,採択率は約
23%と概ね例年通りでした.投稿トピックとしては,およそ三分の一(140件程
度)の論文がデータマイニング・知識発見をトピックとして選んでいる一方,
採択されているのは25件程度であり,やはりデータマイニング「のみ」では採
択されるのは難しいようです.実際,採択数の最も多いトピックは問合せ処理・
インデクシング・最適化であり,確かな手法と実験結果が採択には必要不可欠
なのだと感じます.なお,その他のトピックとしてはRDF・ウェブ・ソーシャ
ルネットワークを含むグラフ処理と,時空間・モバイル・マルチメディアデー
タに関するものが多く投稿,採択されています.

最後になりますが,今回のICDE 2018への参加に関して,一部をACM SIGMOD日
本支部にご支援いただきました.興味深い基調講演の聴講など,大変有意義な
時間を過ごす機会をくださったことに,この場をお借りして感謝申し上げます.
なお,第9回ソーシャルコンピューティングシンポジウム(SoC 2018)と共催
で行われるACM SIGMOD日本支部第68回支部大会にて,より詳細な参加報告を行
う予定です.こちらの記事では省略したBest Paperなどについても紹介する予
定ですので,興味をもたれた方は是非お越しください.

第9回ソーシャルコンピューティングシンポジウム(SoC 2018)
URL:http://db-event.jpn.org/soc2018/
日時:2018年6月22日(金),23日(土)
会場:LIFULL本社(〒102-0083 東京都千代田区麹町1-4-4)

杉浦 健人(名古屋大学 大学院情報学研究科 研究員)

----------------------------------------------------------------------

■2■ DCC 2018 参加報告
                         喜田 拓也(北海道大学)

Data Compression Conference (DCC)は,毎年3月末から4月頭ごろに米国ユタ
州ソルトレークシティのSnowbirdで開催されるデータ圧縮に関する国際会議で
す.ソルトレークシティは2002年に冬季オリンピックが開催された場所で,
DCCの会場となるホテルThe Cliff Lodgeはゲレンデの中にあります.会議の開
催期間中はゲレンデにまだ十分に雪があり,多くの観光客がウィンタースポー
ツを楽しみにやってきます.もちろんレンタルスキー等もありますので,会議
の合間にスキーに行く参加者もいるそうです.会議のウェブサイト
(http://www.cs.brandeis.edu/~dcc/index.html)を見る限り,少なくとも
2022年までは同じ場所で開催されるようです.DCCは例年3日間開催されていま
す.2日目の夕方にはPoster sessionがあり,立食パーティを兼ねています.
今年の開催期間は3月27日から30日でした.今年のRegular sessionの件数は40
件,Poster sessionは42件ありました.私が初めてDCCに参加した20年前と比
べると,Regularの件数が減少(DCC’98では52件)しましたが,Posterが増え
たようなので,参加者の規模はほぼ変わらない印象です.変わったことといえ
ば,ホテルのケータリングが少し豪華になったこと,日米の物価の差が大きく
なって料金が割高に感じるようになったこと,それから,以前はそれほど多く
なかった動画像圧縮関連の発表が現在では主流になったことでしょうか.今回
は私が指導している修士1年の古谷 勇君がPoster sessionで高階圧縮に関する
研究発表を行いました.査読の評価が悪くなかった(accept as a regular,
weak accept as a regular, accept as a poster)のでRegularでの採択に至
らなかったことが残念でしたが,本人は関連分野で人気の高い国際会議の一つ
(Conference H5-index=17, CORE2018 Rank A*)に参加することができて大い
に刺激を受けた様子でした.採択率が公開されないので,どのくらいの投稿が
あったかは明らかでないのですが,Posterとして採択されることは容易だと言
われています.今回の会議で私が気になったRegularでの発表を挙げると,グ
ラフの行列表現を行列の掛け算が実行しやすい形で圧縮するというもの,アル
ファベットサイズが大きい場合においてコンパクトな完備辞書(Rank/Select可
能な辞書)を作るというもの,展開が高速なMarlin圧縮法の符号語をオーバー
ラップさせることで圧縮率を向上させるというもの,それからハードウェアを
用いて数値データのストリームを圧縮するというものです.前者二つは,単に
圧縮するだけでなく,圧縮データ上での処理の簡便さを求めるものです.後者
二つは,圧縮率はもとより,圧縮・展開の速度を高めるというものです.いず
れも,可逆圧縮の付加価値を高める実用的にも有益な研究だと思います.DCC
は,日本の大学研究者にはやや出張手続きが面倒な時期に開催されるのが玉に
瑕なのですが,データベース関連の話も(少ないものの)見かけますので,皆
さんもぜひ参加されてみてはいかがでしょうか.

喜田拓也(北海道大学 大学院情報科学研究科 准教授)

------------------------------------------------------------------------

■3■ WSDM2018 参加報告
                   川前 徳章(NTTコムウェア/東京大学)

International Conference on Web Search and Data Mining (WSDM) 2018は
ACMが主催する国際会議で,今年で11回目の開催となります.例年,2月の開催
で,2018年は2月5日(月)から9日(金)の日程でアメリカのロサンゼルスで
開催されました.この時期,日本はまだ数年に一度の寒波がやってきていて震
えている方も多かったと思います.一方,同じ北半球のアメリカ西海岸は外に
出るとそれほど寒くなかったですが,建物の中はこの時期でも冷房が効いてい
て私は震えていました.場所や季節を問わず,アメリカに行くときは防寒対策
が必要です.会場はMarina del ReyのThe Ritz-Carltonで,シックでゴージャ
スな会場で発表,聴講,ディスカッションに集中し,休憩時はホテル内にある
ピカソやシャガールの絵画鑑賞やベイエリアの散策でリラックスした参加者も
多かったようです.手元に数値データがないのですが,例年に比べて参加者数
やツイート数が少なかったようです.その理由には場所も日程も近いところで
人工知能系の国際会議があったことが関係しているかもしれません.

今年の論文の投稿状況ですが,世界41ヶ国から514件の投稿があり,23ヶ国の
84件が採択(採択率約16%)されています.投稿数は増加傾向にあり,昨年の
投稿数は505件と最多記録を更新しましたが,今年も昨年を上回り投稿数の記
録を更新しました.採択率は前年とほぼ同水準で,開催時から18%前後を保っ
ています.データマイニング/自然言語処理/機械学習/人工知能をテーマにし
た国際会議もWSDM同様にここ数年の投稿数と参加者の伸びは著しく,関連分野
のコミュニティの勢いを感じます.これらのテーマは融合が進み,その境界も
曖昧になって来ているので,ここから便宜上,データサイエンスと言う言葉で
まとめてしまいます.

次に発表者の所属組織と発表内容(論文のテーマ)の傾向を紹介します.発表
者,すなわち論文の著者の所属組織は,大学と企業が半々といったところです.
他のデータサイエンス関連の学会同様,企業はGoogleやMicrosoftからの発表
は依然として多いですが,JDやAlibabaなどの中国にある企業から複数の発表
がありました.発表だけでなくスポンサなどで参加する中国の企業もあり,そ
の数も論文同様に年々数が増えています.論文のテーマは,会議名称に沿い,
Web Search and Data Miningに関するもの,検索やレコメンドなどのWebサー
ビスへの適用を想定したデータサイエンスに関する基礎から応用までの幅広い
研究発表がありました.これらサービスの実現や処理基盤としてデータベース
や大規模データ処理技術は欠かせず,そういったテーマを扱った論文もありま
した.例えばsketchingを用いた分散処理を扱った論文は大規模データ処理を
専門とする方には興味深いと思います.今年採択された論文のタイトルに含ま
れる単語の出現頻度を抜き出しますと,上位10件はLearning,Networks,
Neural,Search,Recommendation,Prediction,Information,Network,Web,
Embeddingとなります.発表される論文は検索やレコメンドに関する研究が多
いのですが,新たなウェブサービスとして定着しつつあるQAシステムやクラウ
ドソーシングに関する研究が目立ちました.特にQAシステムはkey noteでも扱
われ,盛り上がりを見せました.複数テーマに渡る論文の方が多いため,テー
マ毎にトピックを紹介するのは難しいですが,検索は画像検索,ランキング最
適化,オンライン広告の効果測定やMultimodal Queryingによる画像検索,レ
コメンドは購入予測,A/Bテスト,クロスレコメンド,プライバシ保護や長期
間のユーザ行動分析を扱ったものなどがありました.タイムリーな研究として
はフェイクニュースを扱った発表がありました.アプローチ関して言うと,テー
マを問わず,Deep Neural Networkが使った発表が多かったです.逆に,使わ
れていない発表を探すのが早いぐらいに.他のアプローチとしては
Nonnegative Matrix Factorization, Embeddings, Network analysis,
Transfer Learningなどがあります.とはいっても単一のアプローチではなく,
幾つかのアプローチを組み合わせ,例えばDeep Neural NetworkとEmbeddings
やMatrix FactorizationとEmbeddingsといったアプローチが増えています.

次に,WSDMへ論文を通すということですが,他のデータサイエンス関連の学会
と共通する部分で考えてみたいと思います.前提として,データサイエンスの
研究にデータが必要なのは変わらないのですが,アイデアを実装するスキルと
環境のハードルが上がってきているように感じます.それが発表される論文の
テーマや著者の組織に反映されていると思いました.加えて,論文と付随され
るコードに触発された研究者以外の人,例えばエンジニアの作った新しいコー
ドが大量にGitHubにアップされる時代になりました.投稿そして採択前の論文
も同様に数多くWeb上に公開されていることもご存知でしょう.このような状
況で,論文が採択されるためのハードルは以前にも増して高くなっています.
研究の初期段階である文献(コード)調査をしっかりやらないと,折角の研究
成果が既に誰かが発表していたものだったということになりかねません.その
ためにも研究会や組織を超えて不定期に開催される論文の読み会などの外部コ
ミュニティに参加して,情報交換をしてみるのもいいと思います.一人あるい
は所属組織だけでは知りえなかった課題やアイデアに触れられる可能性があり
ます.実際に研究が上手くいって論文を書く段階になってもコミュニティから
のフィードバックがあるかもしれません.WSDMを含めACM系の論文は非ACM系
(随分と大雑把なくくりですが)に比べてページ数が少ない上に,研究成果だ
けでなくその研究の位置付けやモチベーションが明確であることが査読の際に
重視されます.研究の位置付けやモチベーションがはっきりしていないと文献
調査も効率が悪いし,何度も手戻りが発生すると思います.文献調査の段階で
明らかになることもありますが,少なくとも研究着手の際には明確にしておき
たいです.査読はその分野の専門家が担当することが多いですが,そうでない
場合もありますし,最近の傾向として複数の分野にまたがった論文に仕上がる
こともあるでしょう.例えば,(自然言語処理+情報検索)の論文に対して
(機械学習+情報検索)の専門家がアサインされることもあります.前者のス
タンスで書いた論文が,後者の専門家である査読者に回り,提案手法のスケー
ラビリティや計算複雑性の実験や考察不足によりrejectと判定されることも起
こり得ます.そんな場合に備え,論文の初期段階で少し専門が違う方にアドバ
イスを求め,論文執筆時には研究の位置付けや既存研究の箇所で査読者と目線
合わせをできるように説明しておくことをお薦めします.WSDMはここ数年,
double-blindの査読方式を取っており,来年度も継続するようです.査読結果
に直接関係あるかどうか分かりませんが,後から多くの人に読んでもらうため
にも論文のタイトルも考えたいところです.今回採択された論文のタイトルを
見て,自身の専門と興味にマッチしていなかったテーマの論文でも引き込まれ
読んでしまった論文の数は10本を下りません.

会議の特徴として,論文が採択された著者全員に口頭発表の機会があります.
発表形式はshortとlongがあり,今年は前者が58本,後者は23本の論文がアサ
インされました.両者とも論文のページ数は一緒ですが,発表時間は前者が2
分,後者が20分となります.Shortの場合は仕方ないのですが,Longの場合,
20分以内に研究内容を説明することは潔く諦めて?代わりに論文を読むべきポ
イントを紹介する発表者もいました.また会議の伝統としてシングルトラック
であることがあります.そのため,参加者全員が同じ発表を通して聞くことが
できます.WSDMは同じACM系のKnowledge Discovery and Data Mining (KDD)
やThe Web Conference(WWW,昨年まではWorld Wide Web Conferenceでしたが
今年から変わりました)に比べるとやや参加人数が少ないので会議の規模はそ
れほど大きくないために,それだけ参加者と密な交流ができます.また,世界
最先端の研究者とも話し易く友達になれるメリットがあります.来年はオース
トラリアのメルボルンで2月11日(月)から15日(金)に開催の予定です.日
本は寒い時期ですが,南半球のオーストラリアは真夏.おまけに時差ぼけに苦
しまなくて済みそうです.公式サイトによればアブストの締め切りは8月8日
(水),論文の締め切りは15日(水)となっています.夏休みに入り躊躇する
方もいらっしゃると思いますが,まだ2ヶ月あるので投稿を検討されてはいか
がでしょうか?

川前徳章(NTTコムウェア Evangelist/東京大学情報学環 
     セキュア情報化社会研究寄付講座 客員研究員)

========================================================================

--------------------------------
吉田 諭史
日本電気株式会社
Email: s.yoshida1044 [at] gmail.com
--------------------------------