日本データベース学会

dbjapanメーリングリストアーカイブ(2017年)

[dbjapan] DBSJ Newsletter Vol. 10, No. 1: DEIM フォーラム 2017 開催報告,データ解析コンペティションDB部会

  • To: dbjapan [at] dbsj.org
  • Subject: [dbjapan] DBSJ Newsletter Vol. 10, No. 1: DEIM フォーラム 2017 開催報告,データ解析コンペティションDB部会
  • From: Takahiro Komamizu <taka-coma [at] acm.org>
  • Date: Sat, 1 Apr 2017 14:49:48 +0900

┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
┃ 日本データベース学会 Newsletter
┃ 2017年4月号 ( Vol. 10, No. 1 )
┗━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

 
急激な気温差を乗り越えて,ようやく桜の季節になりました.新年度を迎え,
新生活となる会員の方も多いかと思います.気温面,環境面でも変化が激しい
時期ですが,体調管理をしっかりして良いスタートを切りたいものです.電子
広報編集委員会は発足から4年となりました.これからも皆様と共にますます発
展していきたいと考えております.

本号では,3月に開催されました,DB・DE系における国内最大級の会議である 
DEIM Forum 2017 の開催報告並びに,国際会議参加報告を CIDR と AAAI の二
件を掲載しております.また,こちらも毎年恒例となりました昨年度のデータ
解析コンペティションDB部会の開催報告をご寄稿いただきました.SIGIR 2017
に向けた連載記事として SIGIR 2017 で行われるイベントやワークショップに
ついての記事をご寄稿いただきました.

本号ならびにDBSJ Newsletterに対するご意見あるいは次号以降に期待する内容
についてご意見がございましたらnews-com [at] dbsj.orgまでお寄せください.


                                日本データベース学会 電子広報編集委員会
                                     (担当編集委員 駒水 孝裕)

=============================================================

----
目次
----

1. DEIM フォーラム 2017 開催報告     
     実行委員長 豊田 正史 東京大学

2. CIDR 2017 に見たデータベースシステム研究の現在
     小山田 昌史 日本電気株式会社

3. 国際会議 AAAI 2017 参加報告 
     駒水 孝裕 筑波大学

4. データ解析コンペティションDB部会報告
     井上 潮 東京電機大学

5. SIGIR 2017 のソーシャルイベントや併設ワークショップの告知
     欅 惇志 東京工業大学

=============================================================

■ 1 ■ DEIM フォーラム 2017 開催報告
      (東京大学 豊田 正史)

第9回データ工学と情報マネジメントに関するフォーラム(DEIM Forum 2017)
第15回日本データベース学会年次大会

主催:電子情報通信学会データ工学研究専門委員会
      日本データベース学会
      情報処理学会データベースシステム研究会

日程:2017年3月6日(月)〜3月8日(水)
会場:高山グリーンホテル(岐阜県高山市西之一色町2-180)

◎DEIMフォーラム2017開催概要

データ工学と情報マネジメントに関するフォーラム(DEIMフォーラム)は,デ
ータ工学と情報マネジメントに関する国内最大の研究集会です.本フォーラム
では若手研究者の育成およびデータべース研究コミュニティの拡大を主眼とし
ています.今年度の研究発表は366件(2016から34件減,2015からは34件増),
参加者は582名となり,引き続き数多くの皆さまにご参加頂きました.DEIMフォ
ーラムにご参加頂いた皆さま,運営にご協力頂いた皆様には心より御礼を申し
上げます.

◎今年度の取り組み

今年度の新たな取り組みとしては,開催場所の新規開拓,初の貸し切り開催,
発表時間の拡大,企画セッションの新設を行いました.また,slackによる会
議中チャット,ベビーシッターサービスの継続提供を行いました.

開催場所については,これまでに利用していた宿泊施設のキャパシティが十分
でなくなっていることから,数年来候補として挙がっていた飛騨高山の高山グ
リーンホテルを選定しました.今年度は,DEIMフォーラムで初となるホテル貸
し切りでの開催となりました.これにより,会期中気兼ねなく幅広く議論や交
流を深めていただくことができ大変好評をいただきました.またインタラクテ
ィブセッションのポスターを常時掲示するポスターギャラリーが実現しました.

発表件数が昨年より若干減少し,会場は9会場が使えたため,今年度はパラレル
セッション数を9に拡大し,1件当たりの発表時間を15分から18分と拡大しまし
た.より深い議論ができるようになったとご評価をいただきました.さらに,
今年の夏に開催されるSIGIRとの連動企画として「私が愛したSIGIR paper」,
およびDBSJからの企画として「企業のOSSを活用した商品開発や拡販の取り組み
」の2つの企画セッションを新設いたしました.

昨年よりslackというチャットシステムを用いた会議中のオンライン議論を継続
して行っています.まだ会場ごとに利用頻度のばらつきはあるものの発表の概
要や質疑応答をまとめてつぶやいてくださる参加者のご協力により貴重な議論
のアーカイブができております.また,ベビーシッターサービスの提供を今年
度も継続して実施しました.今後も男女共同参画を支援する取り組みとして継
続したいと考えております.

◎プログラムハイライト

今年度は,機械学習研究の新展開と題して,NTTフェロー上田 修功先生より招
待講演をいただきました.自然科学(宇宙ビッグデータ)および社会科学(ス
マートシティ)分野でのビッグデータ分析のための機械学習技術に関する幅広
い実応用例に関してご紹介をいただきました.

日本データベース学会表彰式では,各種表彰が執り行われました.日本データ
ベース学会功労賞記念講演では,金森 吉成先生(群馬大学名誉教授)から,マ
ルチメディアデータベースの具体応用として医療データベースの開発や2002年
ごろから開始された津波デジタルライブラリの構築に関して実践的なデータベ
ース開発に関するの経験についてご講演をいただきました.

研究発表は全部で366件(一般337件,Ph.Dセッション29件)の発表が行われ,
インタラクティブセッションでは,223件のポスター・デモ発表が行われました.
各セッションには,座長1名と2名のコメンテータが付き,活発な議論が行われ
ました.

初日のインタラクティブセッションにおいては,高山市長からのお祝いのメッ
セージの読み上げ,高山ご出身である大阪大学総長西尾先生より高山開催をお
祝いするサプライズ演出のご提供がありました.2日目にはSIGIR共同開催のお
祝いとして国立情報学研究所の神門先生からもサプライズ演出のご提供があり,
両日とも大変な盛り上がりを見せました.

夜は,恒例のBoFセッションが開催されました.喜連川先生,田中先生,清木先
生,北川先生,横田先生らによる「AKB SDB パネルセッション」,SIGIR連動企
画第2弾として「情報検索クイズ~SIGIR2017東京開催記念杯~」,さらに「研
究・開発職に就職したい学生さんに聞いて欲しい!企業人が語る研究開発のリ
アル!」の3つのBoFが開催され普通の時間帯では聞けないような深く濃密な議
論がなされました.

◎DEIMフォーラム運営の裏話

DEIMフォーラムは,多くの運営組織メンバに協力を頂いて,過去の経験を生
かして組織的かつ効率的に運営がなされています.それでも,発表件数と参加
者数が大規模化するにつれて,発表論文のセッション割り当てやコメンテータ
割り当ての負担が非常に大きくなってきております.発表論文のセッション割
り当てに関しては,昨年度に引き続き筑波大の森嶋先生が研究されているクラ
ウドソーシングの技術を利用することで,初期のセッション構成案を自動作成
しました.昨年の経験をもとに様々な改良がなされておりかなりの作業量削減
ができたとの報告がありました.このように研究した技術を我々の手で利用す
るということを今後も続けられればと思います.また,実行委員会とプログラ
ム委員会のメンバ,コメンテータ,学生スタッフ,その他の皆さまのご協力を
得て,無事開催することができました.ご尽力頂いた皆さまに心から感謝申し
上げます.

◎おわりに

発表された方は,DEIMフォーラムの次のステップとして,フォーラムに投稿し
た論文を完成させて国際会議あるいは論文誌に投稿することで,研究者として
成長を目指して欲しいと思います.例えば,信学会では「データ工学と情報マ
ネジメント特集」の和文誌と英文誌を企画していますので,ぜひ投稿をご検討
ください.参加される皆さんによるDEIMフォーラムのご支援とご協力の程,今
後とも宜しくお願いします.


(豊田 正史 東京大学生産技術研究所 准教授)

-----------------------------------------------------------------------

■ 2 ■ CIDR 2017 に見たデータベースシステム研究の現在
      (日本電気株式会社 小山田 昌史)

*** 会議の概要 ***

2017年1月8日から11日にかけて米国カリフォルニア州サンタクルーズで開催さ
れた CIDR (Conference on Innovative Data Systems Research) 2017 に参加
いたしました.CIDR はDB分野のトップレベル国際会議であり,二年に一度,米
国で開催されます.CIDR はJim Gray や Michael Stonebraker などデータベー
スシステムの黎明期を率いてきた研究者が中心となって立ち上げた会議で,
SIGMOD や VLDB などのトップ国際会議と比べると小規模であり,

(1) データベースシステムに関する研究がメインである
(2) Visionary な研究が多い

という傾向があるようです.参加者は100名程度で,DB業界のビッグネーム
研究者(主に北米,ついで欧州),その指導学生,そしてDBベンダの研究者/エ
ンジニア,が中心でした.

会議は4日間で,2件のキーノートと,32件の論文発表がありました(採択
率は公表されていないようです).シングルトラックで全ての発表を聞くこと
ができます.賛否両論あると思いますが,発表を first author でなく last
author などのビッグネームがおこなう形式となっており,ビッグネームによる
発表を数十件も聞くことができる,という点でお得な会議でした.また,会議
の参加費とホテル代を合わせて10万円程度という意味でも,かなりお得な会
議と感じました.

*** キーノート ***

キーノートは MIT の Prof. Samuel Madden による "Putting the Data Back 
in Databases" という発表で,DBコミュニティへの問題提起となっていました.
Prof. Samuel Madden は斬新な発想でデータベースシステム研究を牽引してき
た研究者ですが,

「IoT, 自動運転, ヘルスケアなど現代の重要なアプリケーションにおいて,
データベースシステム(研究)が重要とされていない」

ことに危機感を覚えているとのこと.
「SIGMOD に N 回,論文を通すことが君の目的か?」
「SIGMOD の論文はゴールではない.ちゃんとアイディアを売り込んで,社会に
  技術を出すところまでやろう」
とメッセージを伝えていました.
質疑応答は盛り上がり,Prof. Michael Stonebraker は「物理の分野では,プ
ロジェクトの数は絞り,各プロジェクトに数多くの人を投入することをやる.
そうしてインパクトの大きな仕事をやっている.DB分野でも同じようなことを
やれば,もっと世界に貢献できるのではないか」などと意見を述べていました.

*** 研究発表 ***

データインテグレーション,データベース統合,データベース設計,ストリー
ム処理,トランザクション処理など,データベースシステムの主要テーマがバ
ランス良く発表されていました.研究の傾向としては,異分野の技術をデータ
ベースシステムに応用する研究が多いように感じました.例えば強化学習にお
ける多腕バンディットのテクニックをマルチテナントDBでのクエリ性能予測に
利用するもの,OLTPデータベースでのワークロード見積もりに Deep Neural
Networkを利用するもの,定理証明系でSQLの同一性判定をおこなうもの,など
です.複数分野にまたがる知見や異分野の研究者との協働が重要であると改め
て痛感しました.

*** おわりに ***

CIDR にはぜひ一度参加したいと考えていましたが,実際に参加してみるとデー
タベースシステムコミュニティの問題意識や方向性を肌で感じることができ,
とても貴重な体験となりました.日本からの参加者が少なかったため,ぜひ皆
様も論文投稿や聴講での参加をご検討して頂ければと思います.


(小山田 昌史 日本電気株式会社)

-----------------------------------------------------------------------

■ 3 ■ 国際会議 AAAI 2017 参加報告 
      (筑波大学 駒水 孝裕)

2017年2月4日から2月9日にアメリカカリフォルニア州サンフランシスコの
Hilton San Francisco Union Square Hotelで開催された「AAAI 2017」に参加
致しました.人工知能系のトップカンファレンスで多くの分野から注目されて
おり,1692名が参加しておりました.参加者が昨年の1289よりも400名近く増加
するという盛況ぶりでした.2500件を超える投稿があり昨年の2100件超から大
幅に投稿数が増えました.採択率は24.9%と比較的高めになっており600件超の
研究が発表されておりました.日本からは100件弱の投稿があり,日本からの論
文の採択率は27%程度でした.これらのことからAAAI という会議が注目されて
いることがうかがわれます.

会議のスケジュールは 2月4日から5日にチュートリアルを集中的に行い,2月
6日から2月9日に本会議を行う,という構成になっています.チュートリアル
では多岐にわたる技術の紹介がされています.一部のチュートリアルはチュー
トリアルの内容を Web で公開しています(例えば,深層学習に関するチュー
トリアル SUA1 は https://sites.google.com/site/dliftutorial/).本会議
中で,キーノートが 5 件ありました.対話システムに関するキーノートや強
化学習に関するキーノート,自動運転に関するキーノートなど機械学習に関わ
るキーノートが多くありました.AAAI は一セッションにつき 6-15 本の論文
が割り当てられており,なんらかの基準で選ばれた 3-4 本論文が口頭で発表
され,残りの論文はライトニングトーク形式で短時間でのアピールの後にポス
ターセッションにて議論を行います.

深層学習への注目の高さが AAAI 2017 での深層学習の発表の多さからも見る
ことができました."deep learning" という語句が含まれている論文以外にも
"embedding" などの深層学習を利用した技術に関する研究やその結果を利用し
た研究などが多くありました.深層学習の仕組みを提案する,という趣旨の論
文よりも深層学習の技術を利用したアプリケーションの話の方が多い印象でし
た.例えば,graph embedding を利用したグラフ補完(あるべきエッジを推定
する技術)に関する研究や,graph embeddingとトピックモデルを融合する研
究などがありました.

所感としましては,AAAI は論文の長さも短く,口頭発表も一部の論文しかさ
れないので,興味ある研究について内容を深く知るためにはポスターセッショ
ンで議論するのがいいと感じました.次回の AAAI は 2018年2月4日-10日に
New Orleans, Lousiana, USA で行われます(詳細は http://www.aaai.org/
Conferences/AAAI/aaai18.php)ので,是非投稿をご検討いただければと思い
ます.


(駒水 孝裕 筑波大学 研究員)

-----------------------------------------------------------------------

■ 4 ■ データ解析コンペティションDB部会報告
      (東京電機大学 井上 潮)

データ解析コンペティションは,「共通の実データを元に,参加者が分析を競
う」ことを目的として,平成6年度から毎年開催されています.平成25年度から
は ACM-SIGMOD 日本支部と日本データベース学会ビジネスインテリジェンス研
究グループの共同体制で,データベース分野独自の予選会(DB部会)を開設し
ています.今年度のDB部会の委員構成は,次の通りです.
主査:井上 潮(東京電機大学),関根 純(専修大学),
委員:宇田川 佳久(東京工芸大学),大塚 真吾(神奈川工科大学),
      鬼塚 真(大阪大学),北山 大輔(工学院大学),
      波多野 賢治(同志社大学),増田 英孝(東京電機大学)(五十音順)

平成28年度は8月5日から3月31日までの期間で,ファッションECサイトの実デー
タ(1年間の購買データおよびアンケートデータ,データ提供元企業名は非公開
)の提供を受け,約100チーム,延べ約500名が参加しました.

DB部会の参加は6チームで,12月下旬に中間発表会(ウェブ上),2月20日に最
終発表会を開催し,DB部会主査・委員による厳正な審査の結果,最優秀賞は
「局所例外部分データの自動探索」を発表した鬼塚研チーム(大阪大学),優
秀賞は「ObjectRankを用いた優良店舗の分析」を発表した北山研チーム(工学
院大学)が受賞しました.最優秀賞の鬼塚研チームは,3月10日に開催されたコ
ンペティション全体の成果報告会(各部会代表の13チームが出場)で健闘しま
したが,惜しくも入賞を逃しました.

昨年度と比べて今年度は各チームの解析技術の向上に加えて,ビジネス視点で
の解析結果の有効性が明確化してきた点が大きな成果だったと言えます.現時
点ではDB部会への参加チーム数が少なく,コンペティション全体における存在
感がまだ十分ではありません.このコンペティションは,オープンなデータで
はなく,企業が実際の業務で使用している生に近いデータを利用できること
大きな特徴になっています.平成29年度も8月からスタートする予定ですので,
実践的なデータ解析に興味をお持ちの多数の方々にご参加いただきたく,よろ
しくお願い致します.

参考URLは,以下の通りです.
経営科学系研究部会連合協議会: http://jasmac-j.jimdo.com/
データ解析コンペティションDB部会: http://www.sigmodj.org/dbcomp/


(井上 潮 東京電機大学 工学部情報通信工学科 教授)

-----------------------------------------------------------------------

■ 5 ■ SIGIR 2017 のソーシャルイベントや併設ワークショップの告知
      (東京工業大学 欅 惇志)

東京工業大学の欅と申します.本日は,SIGIR 2017 のボランティアスタッフの
募集を行う予定でしたが,運営委員の予想を大きく上回る勢いで応募頂き,既
に募集人数の上限に達しております (追加募集が生じた場合には,改めてご連
絡いたします).そのため,予定を変更して SIGIR 2017 のソーシャルイベント
や併設ワークショップの論文投稿の告知をさせて頂きます.

SIGIR 2017 公式サイト: http://sigir.org/sigir2017/

・こんなにあるなんて,ソーシャルプログラム!

SIGIR 2017では,多様な参加者の親睦を深めるために,多くのソーシャルプロ
グラムを用意しております.Student Luncheon と Student Get-Together は学
生向けのイベントですが,その他のイベントはどなたでもご参加頂けます.

1. 8月7日(月)18:00-19:00 Women in IR: 分野における男女共同参画を推進
                           する会
2. 8月7日(月)19:00-21:00 ウェルカム・レセプション
3. 8月8日(火)12:30-14:00 Student Luncheon: [学生対象] 学生同士や,ベ
                           テラン研究者との親交を深めるための昼食会
4. 8月8日(火)19:00-21:00 Student Get-Together: [学生対象] 学生同士の
                           親睦会
5. 8月9日(水)12:30-14:00 Diversity and Inclusion Luncheon: 分野におけ
                           る多様性と包括性を理解・促進するための昼食会
6. 8月9日(水)19:00-21:00 バンケット(椿山荘)

積極的にご参加頂けますと幸いです.

・まだまだ間に合います,併設ワークショップ論文投稿!

SIGIR 2017 では,下記の八つの併設ワークショップが開催されます.DB コミ
ュニティで取り組まれているトピックとも強く関連するワークショップもござ
います.残念ながら SIGIR 2017 本会議への投稿が間に合わなかった方や非採
録をお受け取りになられた方は,是非ワークショップへの投稿をご検討くださ
い.SIGIR の Workshop では,ディスカッションを重視しておりますので,今
後のこの分野の研究の方向性などを調査する上でお役立てください

ワークショップ一覧
1. ATIR: Axiomatic Thinking for Information Retrieval and Related Tasks
2. BIRNDL: Bibliometric-enhanced IR and NLP for Digital Libraries
3. CAIR: Conversational Approaches to Information Retrieval
4. ECOM: eCommerce
5. KG4IR: Knowledge Graphs and Semantics for Text Retrieval and Analysis
6. LIARR: Lucene for Information Access and Retrieval Research
7. Neu-IR: Neural Information Retrieval
8. OKBQA: Open Knowledge Base and Question Answering

1. ATIR: Axiomatic Thinking for Information Retrieval and Related Tasks

概要:
This is the first workshop on the emerging interdisciplinary research
area of applying axiomatic thinking to information retrieval (IR) and
related tasks. The ATIR workshop aims to help foster collaboration of
researchers working on different perspectives of axiomatic thinking and
encourage discussion and research on general methodological issues
related to applying axiomatic thinking to IR and related tasks.

2. BIRNDL: Bibliometric-enhanced IR and NLP for Digital Libraries

概要:
The second BIRNDL workshop stimulates IR researchers and digital library
professionals to elaborate on new approaches in natural language process-
ing, information retrieval, scientometrics, text mining and recommendat-
ion techniques that can advance the state-of-the-art in scholarly docu-
ment understanding, analysis, and retrieval at scale. The workshop incor-
porates the third edition of the Computational Linguistics Scientific 
Summarization Shared Task.

3. CAIR: Conversational Approaches to Information Retrieval

概要:
Recent advances in commercial conversational services that allow natural-
ly spoken and typed interaction, particularly for well-formulated ques-
tions and commands, have increased the need for more human-centric inter-
actions in information retrieval. The CAIR workshop brings together aca-
demic and industrial researchers to create a forum for research on con-
versational approaches to search. A specific focus is on techniques that
support complex and multi-turn user-machine dialogues for information
access and retrieval, and multi-model interfaces for interacting with
such systems.

4. ECOM: eCommerce

概要:
The SIGIR Workshop on eCommerce serves as a platform for publication and
discussion of Information Retrieval and NLP research & their applications
in the domain of eCommerce. We bring together practitioners and research-
ers from academia and industry to discuss the challenges and approaches
to product search and recommendation in eCommerce.

5. KG4IR: Knowledge Graphs and Semantics for Text Retrieval and Analysis
公式サイト: https://kg4ir.github.io

概要:
Large, publicly available knowledge graphs have given rise to many success-
ful improvements on traditional information retrieval tasks such as ad hoc
document retrieval.  We focus on the end-to-end utilization of knowledge
graphs and semantics in text retrieval and other IR-related applications.  
Our scope covers the acquisition, the alignment, and the utilization of
knowledge graphs and semantic resources for the purpose of optimizing
end-to-end performance of a system that responds to a user's information
need. Examples of such technologies and applications include entity rank-
ing, entity linking, entity-based retrieval models, entity recommendation,
document filtering, knowledge graph population, and more.

6. LIARR: Lucene for Information Access and Retrieval Research

概要:
The LIARR workshop brings together the community of researchers using
Lucene, and its derivatives like Solr and Elasticsearch, and develop tools
for IR research. There are three goals: First, create a development plan
and common codebase for IR research with Lucene.  Second, implement vari-
ous information retrieval methods in Lucene/Solr/Elasticsearch,  Third,
evaluate the quality of such methods and models.  LIARR is not a tradi-
tional “mini conference”-style workshop but rather it is a hackathon for
attendees to actually work with Lucene in a hands-on capacity. Presenta-
tions are meant as a tool for structuring and guiding the efforts of
attendees. Hence, the workshop motto of: less yaking, more hacking.

7. Neu-IR: Neural Information Retrieval
公式サイト: http://neu-ir.weebly.com

概要:
The Neu-IR workshop brings the neural IR community together to specifical-
ly address key challenges facing this line of research. The workshop
requests the community to submit proposals on generating large scale
benchmark collections, building a shared model repository, and standardiz-
ing frameworks appropriate for evaluating deep neural network models. In
addition, the workshop provides a forum for the growing community of IR
researchers to present their recent (published and unpublished) work in-
volving (shallow or deep) neural network based approaches in an interac-
tive poster session.

8. OKBQA: Open Knowledge Base and Question Answering

概要:
The Second OKBQA Workshop aims to join forces in the collaborative devel-
opment of open frameworks for knowledge extraction and question answering,
to share standards, and to foster the creation of an ecosystem of tools
and benchmarks. Specific topics include natural language interfaces for
the Web of Data and the construction of knowledge bases for question
answering.


(欅 惇志 東京工業大学 助教)


--
Takahiro Komamizu
Ph.D. in Engineering
University of Tsukuba