日本データベース学会

dbjapanメーリングリストアーカイブ(2017年)

[dbjapan] DBSJ Newsletter Vol. 10, No. 4: SoC 2017, SIGMOD 2017, GTC 2017, SIGIR 2017アナウンスメント


┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
┃ 日本データベース学会 Newsletter
┃ 2017年8月号 ( Vol. 10, No. 4 )
┗━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

梅雨が終わったと思ったと同時に,真夏がやってきました.蝉時雨が降り注ぎ,
青空がまぶしく,外にいると,立っているだけでもじりじりと体力と気力が失
われていきます.熱中症などにならないように,くれぐれも適切な体調管理を
心がけていただければと思います.

本号では,6月に東京にて開催されました,第8回ソーシャルコンピューティン
グシンポジウム(SoC 2017)の開催報告ならびに,国際会議報告として,5月
中旬に開催されたSIGMOD 2017と,近年注目が集まっているGPU Technology
Conference 2017についてご寄稿いただきました.また,開催が目前に迫っ
たSIGIR 2017連載記事として,開催直前の参加案内記事もご寄稿いただきました.

本号ならびにDBSJ Newsletterに対するご意見あるいは次号以降に期待する
内容についてご意見がございましたらnews-com [at] dbsj.orgまでお寄せください.


                          日本データベース学会 電子広報編集委員会
                          (担当編集委員:塩川 浩昭)

=======================================================================

----
目次
----

1. SoC2017開催報告
    莊司慶行 (京都大学),北山大輔 (工学院大学),大塚真吾 (神奈川工科大学)

2. SIGMOD 2017に参加して
    西村祥治 (日本電気株式会社)

3. NVIDIA GPU Technology Conference参加報告
   江田毅晴 (日本電信電話株式会社)

4. SIGIR 2017開催直前のご案内
    高久雅生 (筑波大学)

=======================================================================

■1■ ソーシャルコンピューティングシンポジウム(SoC2017)開催報告
 莊司慶行 (京都大学),北山大輔 (工学院大学),大塚真吾 (神奈川工科大学)

今年で第8回を数えるソーシャルコンピューティングシンポジウムが,6月23,
24日に『株式会社リクルートテクノロジーズ グラントウキョウサウスタワー
41F アカデミーホール』で開催されました.今回よりACM SIGMOD日本支部
の支部大会とも共催を行うため,開催期間が2日となりました.また,今回か
ら各回の狙いを明確にするために副題を設定しました.初回は「ソーシャルコ
ンピューティングとヒューマンファクター」としました.

1日目は3件の招待講演と6件の一般発表が行われ,2日目は2件の招待講演と3件
の一般発表の他にICDE2017国際会議報告も行われました.2日間の長丁場に
も関わらず,150名を超える参加者を得まして,盛況のうちに幕を閉じました.

SoCでは学生の優秀な発表に対して学生奨励賞を授与しています.厳正な審査
の上,今年度は以下の発表者を表彰しました.おめでとうございます.

阿部隼 様(阪大)
『ユーザのツイート履歴に含まれる単語の出現傾向を用いたライフイベント予測 モデルの構築』

今回も魅力的な招待講演者を多数お招きしましたので,5件の招待講演とICDE
2017国際会議報告に関してレポートしていたします.

松村真宏 先生(大阪大学)による「仕掛学:データなき世界へのアプローチ」
のご講演では,仕掛け学の具体的な定義とその実装についての多数の事例をお
話しいただきました.仕掛けとは,人間に行動を促すものであり,強制されず
とも思わずその行動を取ってしまうようなものをさしており,例えば,階段が
ピアノの鍵盤のようになって,音がなる仕組みになっていれば,運動のためや
健康のためという目的を掲げずとも,自然と楽しんで階段を昇り降りするとい
うような,具体的な事例についてご紹介いただきました.

関喜史 氏(株式会社 Gunosy)による「ニュース推薦システムのサービス応
用とその課題」のご講演では,Gunosyの実際のニュース配信サービスの仕組
みを中心に,ニュース記事の特徴ベクトル,ユーザの特徴ベクトル,多様性の
導入などについてご説明頂きました.内部的な評価値と閲覧率の相関や表示順
を入れ替える実験,興味関心に関係なく共通のニュース記事をランダムな位置
に挿入するなど,実運用サービスならではの実験の話が興味深かったです.

清田陽司 氏(株式会社 LIFULL)による「不動産テックの研究課題:ユーザ
行動ログ,ソーシャルメディア,クラウドソーシングを通じてみるユーザのニ
ーズ」のご講演では,住宅情報検索サイトのHOME'S上でのユーザ行動にとど
まらず,不動産におけるユーザ満足度向上のための取り組みについてご紹介頂
きました.そもそも住まい探しでは購買履歴というのはほとんどなく,意思決
定に時間がかかり,時間とともにニーズも変わる.など,不動産テックならで
はの研究課題についてお話しいただきました.

LIFULL HOME'Sデータセット
https://www.nii.ac.jp/dsc/idr/lifull/homes.html

三澤賢祐 氏(株式会社 Insight Tech)による「不満の声と向き合うため
の技術」のご講演では,インターネット利用者にお金を払って日常の不満を入
力してもらう「不満買取センター」に関してお話しいただきました.収集した
多量の不満を実際のサービス上でどうハンドリングしているかなど,現場的な
話をたくさん伺うことが出来ました.また,研究機関向けのデータ公開にも力
を入れておられ,数百万件にも及ぶ不満調査データや,それらに人手で付与し
たカテゴリ情報などを情報学研究データリポジトリで公開して下さっていると
のことです.

不満調査データセット
http://www.nii.ac.jp/dsc/idr/fuman/fuman.html

奥田裕樹 氏(リクルートテクノロジーズ)による「リクルートグループの現
場事例から見るAI/ディープラーニング技術のビジネス活用と,”A3RT” 外
部公開の裏側」のご講演では,AIをビジネスとして実サービス化するうえで
重要な「勘所」の話を中心に,リクルートテクノロジーズのAI技術への取り組
みに関してご説明いただきました.また,多くのAI資産をAPIとして公開し利
用可能にする「A3RTプロジェクト」についてご紹介いただきました.定量的評
価の重要さや,長期的な運用の難しさなど,大規模サービスでの実感を伴うお
話はとてもためになると感じました.

A3RT
https://a3rt.recruit-tech.co.jp/

加藤誠 先生(京都大学)による「ICDE2017国際会議報告」では,会議全体の
状況報告およびキーノート3件が紹介され,Apache Flink,IBM Accelerated
Discovery Lab,米国圏におけるMOOC運用の実際とその発展などが紹介され
た.ICDE 2017 Influential Paper Awardsを受賞したプライバシー技
術に関する論文や,Best paper awardを受賞した"Scalable Linear Algebra
on a Relational Database System”が紹介された.また,パネルでは
IEEEデータ工学としてのデータアナリティクス教育に関する多岐に渡る意見が
紹介された.

(莊司慶行 京都大学 学術情報メディアセンター 特定研究員)
(北山大輔 工学院大学 情報学部 准教授)
(大塚真吾 神奈川工科大学 情報学部 准教授)

----------------------------------------------------------------------

■2■ ACM SIGMOD 2017参加および発表報告  西村祥治 (日本電気株式会社)

2017年5月13日から19日にかけて開催されたSIGMOD 2017に参加し、論文発
表を行いました。会議の概要、自身の発表を中心に報告をいたします。

SIGMODはデータベース分野におけるトップ国際会議で、40年以上に渡る長い
歴史があります(第一回は1975年)。データベースの理論を中心に扱うPODSと
は1991年より共催しています。データベース分野ではSIGMODの他、VLDB、
ICDEがトップ国際会議として知られています。今年は、アメリカのシカゴにて、
5/13-19までの6日間の日程で開催されました。参加人数は約750名でした。昨
年度はIT企業が集まるサンフランシスコでの開催であり過去最高の1000名越え
でしたので、残念ながら減少しましたが、ここ数年は増加傾向にあります。また、
日本からは私を含め、4件の発表がありました。おそらく歴代のSIGMODの中で最
も多くの日本人筆頭論文がでた年になったのではないかと思います。

プログラムは基調講演2テーマ5件、受賞講演6件、論文発表100件(research
paper 96件、invited industrial paper 4件)、チュートリアル13件、
デモ31件からなります。Research paperの総投稿数は489件で採択率は20%
でした。ここ10年の採択率は18〜25%あたりになります。

PC Chairの報告によると、採録された論文のうち一発で採録になるのは1割も
ないようです。大半はRebuttalというレビュアのコメントに基づいた改訂をす
る機会をくぐりぬけています。Rebuttalにまわった論文のうち約8割が採録に
至るようです。また、論文によってはShepherdというレビュアの指導を受ける
場合があります。このように、SIGMODは著者だけでなくレビュアとの共同作業
で論文を拾い上げ、育てるポリシをとっているようです。

論文発表は、30セッション5並列で行われました。各論文発表者は、一人1分1ス
ライドで研究紹介をするTeaser Talk、25分間の論文発表、2時間のポスター
発表をする機会が与えられます。また、論文発表の模様はビデオ録画され、
YouTubeにアップロードされます(希望すればOpt-outの選択も可)。また、論文
を紹介する動画を事前にアップロードすることも推奨されました。

発表内容のトレンドとしては、機械学習に関連する研究や新しいハードウェアを
活用した研究に注目が集まっている印象を受けました。また、システム中心から
人中心へという研究の流れがあるように見え、インタラクティブ性やユーザビリ
ティを意識した発表も散見されました。私個人としては、基調講演の
Approximate Query ProcessingでのBrown大のTim Kraska教授の講演が素晴らし
かったです。システムからUIまでの全体の構想の大きさ、それを構成する各技
術の面白さが伝わってきます。

以下に、発表論文およびビデオのリンク一覧ページのURLを掲載しておきます。
ぜひ、ご覧になりお楽しみください。

採録論文:ACM DLへのリンク一覧
http://sigmod2017.org/sigmod-program/

発表ビデオ:YouTubeへのリンク一覧
http://sigmod2017.org/video/

私自身は、空間充填曲線を用いた多次元索引技術について発表しました。本発表
ではクエリパターンに応じて適切な空間充填曲線を設計する手法を提案しました。
これにより多次元範囲検索の際にアクセスされるページ数を最大で6分の1近
く減らすことが可能になりました。この論文で最も評価を頂いたのは、複合イン
デックスとZカーブを一般化したビット混合曲線を提案した点です。この一般化
により、クエリパターンに適合した曲線を容易に合成することができるようにな
りました。論文発表後の質疑応答やポスター発表でもビット混合曲線のアイデア
は好評で、"I follow it"、"It's cuuuute!"などうれしくなる言葉をかけてもら
いました。

Shoji Nishimura and Haruo Yokota, "QUILTS: Multidimensional Data Partitioning
Framework Based on Query-Aware and Skew-Tolerant Space-Filling Curves",
http://dl.acm.org/authorize?N37709


実はこの論文は、ICDE, VLDBとトップ国際会議に挑戦し続けた結果、ようやく
SIGMODで採録になりました。この挑戦を通じて学んだことは、トップ会議に通
るまでしぶとく挑戦しつづけることと、Championしてくれる査読者を得る努力、
工夫をすることです。よく言われることですが、トップ会議のレビューコメント
は充実しています。たとえ今回が不採録でも、指摘事項を直していくだけで、投
稿を重ねる毎に評点が着実に改善していきます。事実、この論文の評点も最高で
Neutralだったのが、Weak Accept、ついにはChampion付きのAcceptへと
評点を伸ばしました。また、私は英文が得意ではないのですが、つたない英語で
も内容を理解してもらえるように図や具体例を多用しました。文法エラーや誤字
・脱字が多いと、歴代の査読者に指摘されましたが、一方で作戦が奏功したの
か、どの査読者からも内容はわかりやすかったとコメントを頂きました。

アイデアを理解、共感してもらえれば、後はRebuttalやShepherdなど改善の
チャンスをたくさん用意してくれています。ですので、トップ会議の壁は確かに
高いですが、越えられない壁ではないです。DBSJのコミュニティから一人でも
多く、トップ国際会議を狙う研究者が増えることを願ってやみません。

来年は、アメリカのヒューストンで6/10-15の会期で開催されます。既に1回目
の投稿期限は過ぎていますが、2回目は10/26がAbstract, 11/2がfull paper
の投稿期限になります。ぜひ、挑戦してください。

(西村祥治 日本電気株式会社)

----------------------------------------------------------------------

■3■ NVIDIA GPU Technology Conference参加報告 江田毅晴 (日本電信電話株 式会社)

GTCは,NVIDIAが主催するGPU技術に関する会議です.昨今GPUはグラフィックス
以外にも幅広く使われており,deep learningにはじまり,自動運転,ヘルスケ
ア,VR/AR,画像処理,HPCといった分野で欠かせない基盤になりつつありま
す.AI技術は日進月歩で進展しメディアで華々しく紹介されますので,研究者で
ないユーザであっても先端技術への目が肥え要望の質が高くなるという状況があ
ります.そのため,私のように企業でAIを扱う部署で働いていると,最先端AI技
術の到達点をキャッチアップし続けることは,重要な課題の一つになります.そ
の点において,GTCはアカデミアから大手クラウドベンダ・大手自動車メー
カー・各種ベンチャー企業・官公庁までもが会することで,この1年間に発表さ
れた最先端のAI技術やサービス,展示物に触れることが可能となっており,非常
に重宝するイベントと言えます.我々と同じような立場の人が世界中に増えてい
るせいか,GTCはこの5年で3倍に増加し,参加者は7000人を超えたようです.

今年の注目セッションとして,まず deep learning フレームワークに関するそ
れぞれの開発者からの発表を挙げます.ここで言うフレームワークと
は,deeplearning向けミドルウェアのこことであり,deep learningモデルを定
義可能な言語を提供し,CNNやLSTMと言った代表的な要素をパッケージとして提
供することで,利用者が自らGPUカーネルを実装することなく,様々なモデルの
設計やGPUを用いた学習を可能とします.フレームワーク競争は群雄割拠の状態
にありますが,ここへ来て代表的なCaffe2,TensorFlow,MXNet,CNTK,がそれ
ぞれ,Facebook,Google,Amazon,Microsoftという大手からOSSとして提供さ
れ,競い合う状況が見えてきました.今後,学習済みモデルが様々な場所に複
製・再配布されて利用されていきますので,モデルを記述・実行するフレーム
ワークの重要性もますます高まると考えられます.DBMSからのアナロジーで考え
ると,言語や保存形式の標準化,統合といった流れや,最適化や分散化といった
技術的課題がどこまで解かれ発展していくのか,辺りは非常に興味深いトピック
です.

もう一つの注目セッションとして,Ian GoodfellowによるGANの最新技術動向を
紹介したセッションを挙げます.GAN(Generative Adversarial Networks,敵対的
生成モデル)は,新しい生成モデルとして2014年にIan Goodfellowによって提案
され,改良され続けながら,絵を描く・補完する・変換するといった従来難し
かったタスクにおいて驚異的な成果を達成し,現在も様々な改良・応用が試みら
れています.提唱者による最新動向の分かり易い紹介を直接聴けたのは素晴らし
く,GANの研究が驚異的なスピードで進展していることにも驚かされまし
た.The GAN Zooというサイトによれば,毎週のようにarxivサーバにGANに関す
る論文が投稿され,ほぼ同時にgithubに再現コードが公開されています.その再
現コードをforkした後続研究が直ぐに投稿されるというサイクルを繰り返すこと
で,世界が一体となってオープンにGANに関する研究を推し進めていることが感
じられます(2014年に出版されたGANの原論文は,既に被引用数が800を越えてい ます).

GTCの特徴の一つとして,CUDAやJetson,各種フレームワークのチュートリアル
やハンズオンが非常に充実しているという点があり,対面で開発エンジニアに直
接疑問をぶつける事もできます.deep learningの開発環境全般について学ぶと
いう目的でも得られるものが多いイベントです.

次回は2018年3月に開催が決まっていますが,参加する場合は入念な準備をお勧
めします.ホテルはかなり前から押さえる必要があります。並列セッション数が
非常に多いため,発表タイトルレベルで聴講予定をたてないと重要なセッション
を見逃すことになります.私のチームでも,分担して聴講計画をたてたり,どう
しても参加が不可能なセッションは,gputechconf.comから辿れるGTC On-Demand
で録画ビデオを見ることで情報収集を行いました.GTC On-Demandは一般公開さ
れており誰でも聴講できるので,まずは興味のあるトピックを探して,ビデオを
見ることで雰囲気を感じるのも良いと考えられます.

(江田毅晴 日本電信電話株式会社)

----------------------------------------------------------------------

■4■ SIGIR 2017 開催直前のご案内  高久雅生(筑波大学)

筑波大学の高久と申します.本ニュースレターでも何度かご案内させていただ
いている通り,8月に東京で開催される国際会議SIGIR 2017の日程が近づいてき ました.

* 日時:2017年8月7日(月)〜11日(金)
* 場所:新宿京王プラザホテル(東京都新宿区西新宿2-2-1)

SIGIRは情報検索分野のトップカンファレンス,今年で40回目.初めて日本で開 催されます.

7月20日時点での参加登録者数は822名となっています.SIGIR過去最大の
参加者数は2006年・シアトル(アメリカ)での710名でしたので,今回の参
加者数は過去に例がなく,40年のSIGIRの歴史にも残る会議となりそうです.
組織委員会メンバー一同,嬉しい悲鳴をあげながらも,より良い会議となる
よう,準備を進めております.

本会議プログラムをみると,検索システムの評価手法,検索モデルやランキ
ングアルゴリズム,ウェブやソーシャルメディアを対象とする検索手法,文
書分類や索引付けモデルの提案,ユーザ志向のインタラクティブ検索,情報
推薦やパーソナライズ,クエリ分析など,さまざまな側面からの研究発表が
行われます.今年度からは,ACM TOIS論文誌での採択論文を会議発表する
試みも行われ,まさに最先端の研究成果の報告と交流の場となります.

また,本会議以外では,チュートリアルとワークショップともに,それぞれ
8件のテーマでのセッションが行われます.本年度の人気チュートリアルは
「Neural Networks for Information Retrieval (NN4IR)」と
題するチュートリアルで,ニューラルネットワークに基づく機械学習手法の
情報検索応用の講義が行われます.このチュートリアルセッションの事前登
録者数は現時点で200名を越えており,近年の深層学習に基づく手法の適用
への強い期待のほどがうかがえます.

7月末日までLate Registrationとして,オンライン申込を受け付け中です.
また,会議当日,会場でのOn Site申込も可能です.直前ではありますが,ま
だ間に合いますので,参加してみたいと思われた方はぜひお越しください.

SIGIR 2017 公式サイト: http://sigir.org/sigir2017/

(高久雅生 筑波大学 准教授)

=======================================================================


--
---
Hiroaki Shiokawa, Ph.D
University of Tsukuba
Email: shiokawa [at] cs.tsukuba.ac.jp
TEL: +81-29-853-5524