学会員メーリングリストアーカイブ (2016年)

[dbjapan] DBSJ Newsletter Vol. 9, No. 1: DEIMフォーラム20 16, データ解析コンペティションDB部会


┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
┃ 日本データベース学会 Newsletter
┃ 2016年4月号 ( Vol. 9, No. 1 )
┗━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
 
急激な気温差を乗り越えて、ようやく桜の季節になりました。新年度を迎え、新生活とな
る会員の方も多いかと思います。気温面、環境面でも変化が激しい時期ですが、体調管理
をしっかりして良いスタートを切りたいものです。電子広報編集委員会は発足から3年とな
りました。これからも皆様と共にますます発展していきたいと考えております。

本号では、3月に開催されました、DB系における国内最大級の会議である DEIM Forum 
2016 の開催報告並びに、日本データベース学会功労賞・上林奨励賞の各受賞者の声をご寄
稿いただきました。また、こちらも毎年恒例となりました昨年度のデータ解析コンペティ
ションDB部会の開催報告をご寄稿いただきました。
 
本号ならびに DBSJ Newsletter に対するご意見あるいは次号以降に期待する内容について
のご意見がございましたら news-com [at] dbsj.org までお寄せください。
 
 
                                 日本データベース学会 電子広報編集委員会
 
=======================================================================
 
----
目次
----
 
1. DEIM フォーラム 2016 開催報告
  実行委員長 鬼塚 真 大阪大学
 
2. データベース・データ工学研究者・技術者にとってのSQL規格の意味
  芝野 耕司 東京外国語大学
 
3. 上林奨励賞を受賞して
  秋葉 拓哉 国立情報学研究所
 
4. 情報検索は終わったのか? ~上林奨励賞を受賞して~
  加藤 誠 京都大学
 
5. 日本データベース学会上林奨励賞を受賞して
  松原 靖子 熊本大学
 
6. データ解析コンペティションDB部会報告
  井上潮 東京電機大学

 
=======================================================================
 
■1■ DEIM フォーラム 2016 開催報告     鬼塚 真 (大阪大学 教授)
 
第8回データ工学と情報マネジメントに関するフォーラム(DEIM Forum 2016)
第14回日本データベース学会年次大会

主催:電子情報通信学会データ工学研究専門委員会
      日本データベース学会
      情報処理学会データベースシステム研究会

日程:2016年2月29日(月)〜3月2日(水)
会場:ヒルトン福岡シーホーク(福岡県福岡市中央区地行浜2-2-3)

◎DEIMフォーラム2016開催概要

データ工学と情報マネジメントに関するフォーラム(DEIMフォーラム)は、データ工学と
情報マネジメントに関する国内最大の研究集会です。本フォーラムでは若手研究者の
育成およびデータべース研究コミュニティの拡大を主眼としています。DEIMフォーラムは、
昨年度に引き続き、発表件数および参加者数が増加し、研究発表は400件(昨年度から
2割増)、参加者は630名(昨年度から1割増)となり、数多くの皆さまにご参加頂きました。
DEIMフォーラムにご参加頂いた皆さま、運営にご協力頂いた皆様には心より御礼を申し
上げます。

◎新しい取り組み

今年は新しい取り組みとして、1)開催場所の新規開拓、2)オープニングセッションの設定、
3)ベビーシッターサービスの提供、を行いました。

開催場所については、多くの参加者から新たな開催場所での開催の要望が強かった
ため、DEIMフォーラムに例年参加頂いているいくつかの研究室に事前投票をお願いし、
複数の候補地の中から、ヒルトン福岡シーホークを選定しました。また、参加者数が
年々増えているため、今年はDEIMフォーラムで初となる国際会議場での開催となりました。

オープニングセッションについては、参加者規模が年々増大している一方で、「国際
会議で通常行われているようなオープニングセッションが必要」というご意見を頂いて
いたため、オープニングセッションを設定いたしました。また発表件数が400件であった
ため、パラレルセッション数を8に拡大するとともに、セッション間の休憩時間を15分~
20分と長くすることで、従来よりも休憩時間で議論ができるよう開催プログラムを設計
致しました。

ベビーシッターサービスの提供については、会場内で預けることができるように準備
をしました。実際には、参加日程の都合などでベビーシッターサービスを利用される
方はおりませんでしたが、今後とも男女共同参画を支援する取り組みとして継続
したいと考えております。

◎プログラムハイライト

今年は大規模グラフデータの分析というトピックに関して 2件の招待講演を頂きました。
Jeffrey Xu Yu 教授 (The Chinese University of Hong Kong)からは「Exploring New
Issues in Online Social Networks」と題して、ソーシャルグラフの分析にはどのような
新たな技術課題があって、その技術課題をどのような優れた方法で解決するかについて、
多様な観点からご講演頂きました。
また、藤澤 克樹 教授 (九州大学)からは「大規模グラフ解析と都市 OS の開発 -ヒト・モノの
モビリティに関する新しい数理モデルとその応用-」と題して、最先端理論(Algorithm Theory)
+ 大規模実データ(Big Data)+ 最新計算技術(Computation)の有機的な組合せによって、
交通量や電力網などにおける最新のグラフ解析の応用についてご講演頂きました。

日本データベース学会表彰式では、各種表彰が執り行われました。詳細は、引き続く受賞
者の声に譲りますが、受賞された皆様大変おめでとうございました。日本データベース
学会功労賞記念講演では、芝野 耕司 教授(東京外国語大学)から、「SQL言語の開発と
日本の貢献」と題して、どのような経緯を経て関係モデルの問い合わせ言語としてSQL
言語が選定され、その後に機能強化が成されたか、またSQL/MMの提案を中心として
日本のコミュニティがどのようにSQL標準に貢献してきたかという、標準化に関わって
いない技術者・研究者には伺い知れない貴重なお話を頂戴しました。

夜は、恒例のBoFセッションが開催されました。トピックは、「企業人が語る! 企業研究者の
イケてる所・イケてない所」、「この先生きのこるには」、「Keep calm and love your boss」と
内容の濃いセッションが繰り広げられました。また、BoFセッションの後はヒルトンの34Fの
会場で夜遅くまで盛り上がっていました。

◎DEIMフォーラム運営の裏話

DEIMフォーラムの運営は、多くの運営組織メンバに協力を頂いて、過去の経験を生かして
組織的かつ効率的に運営がなされています。それでも、発表件数と参加者数が大規模化
するにつれて、発表論文のセッション割り当てやコメンテータ割り当ての負担が非常に大きく
なってきております。発表論文のセッション割り当てに関しては、今年度は筑波大の森嶋
先生が研究されているクラウドソーシングの技術を利用することで、初期のセッション構成
案を自動作成してみました。この初期の案に対して人の目で見て構成を修正しましたが、
例年に比べて体感的には3割程度の作業量削減ができたと思います。このように研究した
技術を我々の手で利用するということを今後も続けられればと思います。
また、実行委員会とプログラム委員会のメンバ、コメンテータ、学生スタッフ、その他の
皆さまのご協力を得て、無事開催することができました。
ご尽力頂いた皆さまに心から感謝申し上げます。

◎おわりに

発表された方は、DEIMフォーラムの次のステップとして、フォーラムに投稿した論文を
完成させて国際会議あるいは論文誌に投稿することで、研究者として成長を目指して
欲しいと思います。例えば、信学会では「データ工学と情報マネジメント特集」の和文誌と
英文誌を企画していますので、ぜひ投稿をご検討ください。また、個人的には「何年後に
DEIMフォーラムの参加者数が1000人に達するのか(しないのか)」が気になります。
参加される皆さんによるDEIMフォーラムのご支援とご協力の程、今後とも宜しくお願い
します。

(鬼塚真 大阪大学大学院情報科学研究科 教授)
 
--------------------------------------------------------------------
 
■2■ データベース・データ工学研究者・技術者にとってのSQL規格の意味                 芝野 耕司(東京外国語大学 教授)
 
データベース・データ工学の研究者・技術者にとって、SQL規格とは何かを考えた場合、
公的規格であることと技術仕様書のベストプラクティスとの2つの側面がある。
科学であれば、真理を発見し、学術論文として発表することで仕事は完結する。これに
よって大きく言えば、人類の知を拡大することになる。しかし、工学分野では、科学とは
目的が異なる。工学の基本的な目的はものをつくり、このものづくりを通して、人類社会
に貢献することにある。

工学分野での研究者・技術者にとっては、研究をし、論文を書くだけではなく、実際に
システム・製品開発を通じて、社会に貢献することが必要となる。開発し、出荷した製品
が市場で受け入れられ、成功を収めると、実質上の標準(デファクトスタンダード)として、
多くの人の役に立つことができる。この製品化を通じての社会貢献と別に、工学分野では
公的標準(デジュールスタンダード)を通じて、より大きく社会に貢献することができる。

市場で成功した製品は実質上の標準と位置づけることができるが、とはいっても、一つ
の企業の製品であり、特許や著作権によって、保護され、他の企業が同じものを作ること
はできない。この独占によって、価格が下方硬直的になるだけではなく、開発会社自体や
その製造に問題が生じた場合、ユーザ企業にも障害が及ぶことになる。一方、公的標準は、
知的財産権の問題をクリアし、誰でも規格に準拠した製品を開発することができる。しか
し、従来公的標準だけが担ってきたオープンスタンダードとしての役割は、知的財産所有
者が自分の権利を制限し、ソースコードまで公開するOSSでも、公的標準に匹敵する貢献が
可能であり、現在では、公的標準とOSSとのすみ分けが重要となっている。

規格票と呼ばれる規格文書は、技術仕様書そのものである。

1980年台半ばまでIBMはユーザに対して、製本としてのオブジェクトコードとユーザマニュ
アルを提供するだけではなく、ソースコードを公開し、設計仕様書であるロジックマニュ
アルを公開していた。IBMの研究開発部門では、研究者・技術者は、仕様書を書くだけでは
なく、プログラムも直接開発するのが当然である。ソフトウェア開発に関係するアメリカ
の企業ではどこでも本社の研究者・技術者が仕様書も書けば、実際にプログラムも書く。

SQL規格は、IBMでロジックマニュアルと呼ぶ技術仕様書にほかならない。すなわち、
SQL規格で“処理系依存”または“処理系定義“とする事項を補えば、仕様書そのものが完成す
る。

ソフトウェア仕様書の中でも多くの研究者・技術者が関わって、開発される国際規格は、
数人の査読委員が査読する論文とは異なり、少なくとも世界中で数十人以上、SQLの最盛期
であれば、数百人以上の専門家が機能拡張提案や規格仕様のレビューに当たる投票コメン
トを作成し、数十人以上が参加する編集会議で仕様書の編集が行われている。

論文査読の場合、基本的には論文の採否を決めるだけであるが、国際規格の郵便投票で
は仕様の細部にわたって問題点の指摘を行うだけではなく、修正提案や機能拡張仕様提案
を行い、国際的な共同開発体制に規格が開発される。

20年ほど前には、日米のソフトウェア技術者の給与水準はほぼ同じくらいであったのが
日本は半分になり、アメリカでは倍以上と大きく給与水準が異なってきている。これには
様々な要因があろうが、一つには、日本では分業化、外注化、派遣化が進み、ソフトウェ
ア開発を付加価値部門ではなく、コスト部門として、開発コスト削減だけを目指し、プロ
グラミングをブルーカラーの仕事とした事にあったかと思われる。

また、要求仕様書、概念設計書、詳細設計書と多くの文書を作成し、本社の研究者・技
術者は仕様書を書くだけでプログラミングは行わないとする商慣行も日本のソフトウェア
技術者の賃金を下げ、一方、日本の企業のソフトウェア開発力をそぐことになっているの
ではないかと思っている。

ぜひ、SQL規格を技術仕様書のベストプラクティスと捉え、規格書を読み抜く事によって、
日本のソフトウェア開発のあり方を考えなおす契機として頂きたい。
 
(芝野 耕司 東京外国語大学 アジア・アフリカ言語文化研究所 教授)
 
--------------------------------------------------------------------
 
■3■ 上林奨励賞を受賞して   秋葉 拓哉(国立情報学研究所 特任助教)

このような名誉ある賞を頂いたこと、身に余る光栄に感じております。改めまして、ご推
薦くださった方々をはじめ、日本データベース学会の皆様に感謝を申し上げたいと思いま
す。

このような高い評価を頂くことにつながる業績を私が達成できたのは、数多くの幸運によ
る部分が大きいと考えています。私の専門は大規模グラフデータを処理する高性能なアル
ゴリズムとデータ構造の設計です。卒業研究のトピックに悩んでいる時、ふとしたきっか
けで見つけ感激したのが、SIGMOD 2010 の大規模グラフ上の最短経路クエリに関する論文
でした。研究の世界をよく知らなかった当時、データベースの学会といえば本当にデータ
ベースシステム自体についてのみ研究をしているのではないかと思い込んでいましたし、
かなり不思議にも思いましたが、この論文は自分の興味・価値観に、ばっちり、これ以上
ないほど、合致していました。「こういう研究がしたい!」と思い、卒論ではこの論文に
基づいた研究を行い、その後も関連した研究を行ってきました。あの論文に偶然出会えた
ことや、大規模グラフのアルゴリズムというトピックがその後ブームを迎えてくれたこと
など、とても運が良かったと思います。

本当に有り難いことですが、いよいよ「運が良かっただけだ」では済まされないような高
い評価を頂いてしまっているように感じます。今後、より一層身を引き締めて頑張ってい
きます。

(秋葉 拓哉 国立情報学研究所 特任助教)

--------------------------------------------------------------------
 
■4■ 情報検索は終わったのか? ~上林奨励賞を受賞して~   加藤 誠(京都大学 特定助教)

このたび、上林奨励賞を頂戴し大変嬉しく思っております。これまで共に研究をしてくだ
さった方々、また、ご推薦くださった方々、日本データベース学会の皆様に対し改めて感
謝申し上げます。

私は研究が非常に好きです。特に情報検索の研究というものは極めて楽しく、工学的・心
理学的側面を持つが故の多様なアプローチ、必要な情報を必要な人に効率的に届けるとい
う簡潔かつも遠大な目標など多くの魅力に今もなお惹かれております。好きなことをした
結果に対し、このような評価をいただくというのはなかなかに得がたい喜びであります。

一方で検索エンジン技術の発展の末、何らかのキーワードを入れればおおよそ良い結果が
得られるような現状であるため、情報検索研究の必要性をあまり感じない方が増えてきて
いるのではないかと危惧しております。実際にある著名な企業の研究者の方に「Search 
is over」と言われ、他分野の研究をしてはどうかと勧められたことがありました(文脈か
ら切り離して書いているので誇張気味になっております)。おそらく、ここ数年は製品に
直接結びつくような検索の研究が少ないことを受けての感想だったのではないかと思いま
す。そのような理由が思いついたためか、特に私自身がその言葉に衝撃を受けることはあ
りませんでした。

合間での会話だったため「Search is over」に対し直接反論できませんでしたが、私がそ
の後に思いついたより適切な言葉は「*That search* is over」でした―「入力されたキー
ワードに関する話題を含むような情報を見つけること」、これについてはもしかしたら終
わったのかもしれません。しかしながら、一般的な「Search」自体はまだまだ多くの課題
を抱えており、アルゴリズムの改良のみによって解けるような問題ばかりではありません: 
このような文書を書く上で気をつけることは何か、自分が忘れている重要な情報は何か、
次の就職先を決める際に知っておくと良い情報は何か。これらは本当に私自身が欲しい情
報であり、私の行く末を左右しかねない情報でありますが、私はこれらを検索エンジンで
検索できないであろうことを知っているため、私がこれらの情報を検索する機会はありま
せん。そのため、私が入力するようなクエリについては常に検索エンジンは良い結果を返
してくれます。これが「Search is over」の正体ではないか。つまり、情報検索の範囲を
限定すれば現状の技術は十分に見えるが、実のところ本当に欲しい情報は検索しようとも
思われず、そのような情報を探し出すことはテクノロジーの問題だと思われていないので
はないか。 

上述の弁は、特に何の問題も解決しておらず、「Search is over」と言った本人へのメッ
セージではないためあまり格好のつかないものとなっています。なぜこのようなことを書
いたかというと、この「Search is over」のちょうど10日後に今回の上林奨励賞受賞の話
をいただいたためです。その名の通り、上林奨励賞は「これからももっと頑張れ」という
意味合いを持つと伺っております。これに対し勝手に解釈を加えて、今回の受賞は、
「Search is over」と言われようがとにかくもっと情報検索の研究を頑張れ、という意味
ではないかと思っております。ここで述べたようなあまり実りのない反論に止まらず、
「Over」した以外の問題に取り組むことで既存の情報検索の範囲を広げ、
「Search is *never* over」と言えるぐらいのことをしたいと思っております。

(加藤 誠 京都大学大学院情報学研究科 特定助教)

--------------------------------------------------------------------

■5■日本データベース学会上林奨励賞を受賞して   松原 靖子 (熊本大学 助教)
 
この度は上林奨励賞受賞の栄誉を賜り、誠に光栄に存じますとともに、深くお礼申し上げ
ます。上林先生は、私が研究者を志す上での大きな憧れでしたので、今回の受賞を非常に
嬉しく感じつつも、同時に誠に畏れ多く感じております。

私が京都大学大学院、社会情報学専攻博士後期課程に入学したのは2009年でしたので、残
念ながら上林先生に直接お会いすることはできませんでした。しかしながら、私の出身研
究室である吉川研究室では、上林先生の面影を様々な場面で感じることができました。そ
して私の大師匠である吉川先生も、上林先生のお名前を口にしては、素晴らしい方だった
とおっしゃっておられました。そのような環境で研究に取り組んでいく中で、上林先生は
私にとって大きな憧れとなり、上林先生が認めて下さるような一人前の研究者になりたい
と強く思うようになりました。

私が人生をかけて取り組んでいる研究テーマは、「大規模時系列データの解析と将来予測」
です。将来予測は非常に難しい研究テーマですが、従来手法とは全く異なるアプローチに
基づく、革新的な時系列予測技術を開発したいと考えています。私自身、そして私の師で
あり研究のパートナーである櫻井先生が常に掲げている目標は、世の中において広く使わ
れるような社会に役立つ基盤技術を作ることです。優れた技術とは、社会に役立つ技術に
他なりません。闇雲に論文を書き連ねてみても、役に立たなければ不十分です。そういっ
た意味では、私はまだ国際的な場で論文を少しばかり発表したに過ぎず、産業貢献も社会
貢献も果たしておりません。今後は、時系列予測の技術を通して世の中の様々な人々を豊
かにするような取り組みをしていきたいと考えております。

私の研究者人生はまだ始まったばかりです。今後の長い研究者人生において、目先の利益
にとらわれて本質を見失うようなことなく、一つの大きな志に向かって努力を怠ることな
く着実に歩みを進めていきたいと考えております。まだまだ未熟ではありますが、上林奨
励賞の名に相応しい研究者になれるよう、そして日頃からお世話になっているDBコミュニ
ティに貢献できるよう、よりいっそう精進していく次第です。何卒よろしくお願いいたし
ます。

(松原 靖子 熊本大学大学院自然科学研究科 助教)
 
--------------------------------------------------------------------
 
■6■ データ解析コンペティションDB部会報告   井上潮 (東京電機大学 教授)

データ解析コンペティションは、「共通の実データを元に、参加者が分析を競う」ことを
目的として、平成6年度から毎年開催されています。平成25年度からはACM-SIGMOD日本支部
と日本データベース学会ビジネスインテリジェンス研究グループの共同体制で、データベー
ス分野独自の予選会(DB部会)を開設しています。今年度のDB部会の委員構成は、次の通
りです。
主査:井上潮(東京電機大学)、関根純(専修大学)、
委員:宇田川佳久(東京工芸大学)、大塚真吾(神奈川工科大学)、
鬼塚真(大阪大学)、北山大輔(工学院大学)、波多野賢治(同志社大学)、
増田英孝(東京電機大学)(五十音順)

平成27年度は8月4日から3月31日までの期間で、東京都板橋区および株式会社アイディーズ
の2機関からご提供いただいた実データを用いて、全国から118チーム、延べ約700名が参加
する過去最大規模の大会になりました。また、解析対象データも過去最大の150GBのサイズ
になりました。

DB部会への参加は6チームで、12月下旬に中間発表会(ウェブ上)、2月22日に最終発表会
を開催し、DB部会委員による厳正な審査の結果、「有用性が高い分析結果を生み出す部分
データの探索手法」を発表した鬼塚研チーム(大阪大学)が最優秀賞、「ユーザの食材購
入周期に基づく余剰食材・購入予定食材推定手法」を発表したチーム北山セミナー(工学
院大学)が優秀賞を獲得しました。最優秀賞の鬼塚研チームは、3月15日に開催されたコン
ペティション全体の成果報告会に出場しましたが、惜しくも入賞はできませんでした。

今年度のDB部会の活動において良かった点は、参加チームの解析技術が向上して有効な解
析結果が出せるようになったことが挙げられます。逆に残念だった点は、昨年度よりも参
加チーム数が減ったこと、時間不足のため十分な結果を出すことができなかったチームが
あったことです。来年度も別の機関から実データの提供を受けて、今年度と同様の形態で
実施する予定です。事前に準備をしていただき多数のチームに参加いただきたいと考えて
おります。今後とも皆様のご理解とご協力をよろしくお願い致します。

参考URLは、以下の通りです。
経営科学系研究部会連合協議会: http://jasmac-j.jimdo.com/
データ解析コンペティションDB部会: http://www.sigmodj.org/dbcomp/

 (井上潮  東京電機大学 工学部情報通信工学科 教授)

=======================================================================

--
Daisuke Kitayama
Interactive Media Lab.
Department of Computer Science
Faculty of Informatics
Kogakuin University
Assistant Professor, Ph.D
+81 3-3340-2683
kitayama [at] cc.kogakuin.ac.jp

北山大輔
工学院大学 情報学部 コンピュータ科学科
インタラクティブメディア研究室
助教 博士(環境人間学)
03-3340-2683(内線:2814)
kitayama [at] cc.kogakuin.ac.jp