日本データベース学会

dbjapanメーリングリストアーカイブ(2015年)

[dbjapan] NTCIR-12 IMine-2タスク参加募集(検索関連クエリデータが利用可能になりました)


日本データベース学会の皆様,
(重複して受け取られた場合にはご容赦ください)

京都大学の山本と申します.
NTCIR-12 IMine-2タスクの最終参加案内を
お送りさせていただきます.
参加登録締切は【7月31日】となっております.


##################################################
                  タスク参加募集

     NTCIR-12 検索意図マイニングタスク(IMine-2)

     IMine-2ホームページ:
     http://www.dl.kuis.kyoto-u.ac.jp/imine2/

     NTCIR-12 の参加登録締切:  2015年7月31日
###################################################


=News!=============================================
本タスクに参加していただけると,「Yahoo! 検索」の
【検索関連クエリデータ】を利用いただけます.
(あるクエリと同じセッション内で入力されたクエリや,
共通の文字列を含むクエリ,クリックURLが共通するクエリ,
および,それらのクエリに対する相対頻度など)を利用できることが
決まりました.

http://www.nii.ac.jp/news/2015/0717
http://research.nii.ac.jp/ntcir/news-20150717-ja.html

日本では前例がなく,大変貴重なデータとなっておりますので,
ぜひとも本タスクへのご参加を検討いただければ幸いでございます.
また,MobileClickタスクについても,IMineとは異なる
検索関連クエリデータが利用可能となっておりますので,
そちらも併せてのご参加をご検討いただければと思います.
====================================================


=== 概要 ===
IMine-2(検索意図マイニング)タスクは,NTCIR-12のタ
スクの1つです.NTCIRとは,複数の参加者が,同じ目的,
テストコレクションのもと,互いに技術を競い合う,もし
くは協力することを通じて情報アクセス技術を進歩させる
ことを目的とした国際的なワークショップです.IMine-2
は,ウェブ検索ユーザの検索意図理解を目的としたタスク
であり,後述する,検索クエリの意図理解タスク,あるい
は文書ランキングタスクなどに対してそれぞれのチームが
取り組み,その精度を共通の枠組みで評価します.

IMine-2はこれまでのNTCIRにて実施されてきたIMine,
INTENT,INTENT-2タスクがその前身となっており,情報検
索分野で現在も活発に研究が行われている,検索意図推定,
検索結果多様化に関する世界最大の評価型タスクです.
IMine-2では,これまで扱って来た検索結果多様化だけでな
く,近年活発に取り組まれている統合検索(aggregated
search)の考えをタスク設計に取り入れ,より実際の検索
エンジン技術に即したタスクとなりました.

=== タスク ===

IMine-2タスクでは,下記の2つのサブタスクを設けてお
ります.どの言語のどのサブタスクでも自由に参加いただ
けます.

(1)Query Understandingサブタスク(日,中,英)

Query Understandingサブタスクは,クエリの背後にある
検索意図理解を目的としたサブタスクです.Query
Understandingサブタスクは,与えられたクエリに対し,
考えられる意図を文字列で表現したもの(サブトピック)
を重要度でランクづけして出力します.例えば,「iPhone6」
というクエリに対し,「iPhone6 公式ページ」,「iPhone6 売上」,
「iPhone6 画像」,「iPhone6 故障」といったサブトピック
が出力として考えられます.

これまでの過去のNTCIRで取り組んでいたSubtopic
Miningサブタスクとの違いは,本サブタスクでは,個々の
サブトピックに対し,どの種類の情報をユーザが求めてい
るかという意図も推定する必要がある点です.現在のウェ
ブ検索エンジンは,検索結果ページ中に,通常のウェブペ
ージだけでなく,ニュース,画像,Q&Aといった,様々な種
類の情報がマージされ1つの検索結果ページを構成してい
ます.このように,それぞれのサブトピックに対して,ユ
ーザが求める情報の種類は異なると考えられます.本研究
では,このような情報の種類をバーティカルと呼び,それ
ぞれのサブトピックに適したバーティカルの推定がシステ
ムに求められます.

たとえば,「iPhone 6」というクエリでは,システムに求め
られる出力は下記のようになります.

――
1st: iPhone6 公式ページ Web
2nd: iPhone6 売上      News
3rd: iPhone6 画像      Image
4th: iPhone6 故障      Q&A
 :
――

システムは,上記のような出力を,オーガナイザが配布す
るデータセットや,参加者が独自に用意したデータセット
を用いて生成します.また,システムの出力はトピックの
多様性および,トピックとバーティカルとの対応の適切さ
の両面から評価される予定です.

(2)Vertical Incorporatingサブタスク(中,英)

Vertical Incorporatingサブタスクは,多様な意図を持
つユーザを満足させるためのランキング生成を目的とした
サブタスクです.Vertical Incorporatingサブタスクで
は,与えられたクエリに対して,多様化されたランキング
を出力するタスクです.このサブタスクでは,システムは
単に様々なサブトピックをカバーするような多様なランキ
ングを生成するだけでなく,Webページ,画像,ニュース
といった異なるバーティカルからの情報を適切に統合し1
つのランキング結果を作成することが求められます.本サ
ブタスクは中国語および英語によるタスクが設けられてお
り,検索エンジンからクロールされたウェブ文書集合,
SogouT,ClueWeb12-B13コーパスなどがデータセット
として用意されます.

=== データセット ===
IMine-2では,それぞれのサブタスクに取り組むため,参
加チームに下記のデータセットを配布することを予定して
います.

- 「Yahoo! 検索」検索関連クエリデータ new!
- 各種ウェブ検索エンジンのクエリ推薦,補完データ
- Sogou検索エンジン(中国における検索エンジン)
   - クエリログ(SogouQ)
   - 中国語文書コーパス(SogouT)
- 英語ウェブ文書コーパス(ClueWeb12-B13)
- Bingから収集されたウェブ文書集合(中,英)

=== 日程 ===

2015年7月        テストクエリ・データセット公開
2015年7月31日	参加登録締切
2015年10月31日   結果提出締切
2016年2月1日     評価結果公開
2016年3月1日     ドラフト論文 提出締切
2016年5月1日     最終論文 提出締切
2016年6月7-10日   NTCIR-12 conference @ NII

=== 参加方法 ===

本タスクに興味を持たれた研究グループはぜひNTCIR参加
登録ページhttp://ntcir.nii.ac.jp/NTCIR12Regist/
にて参加登録をお願いいたします.

また,タスク参加者は 1) NTCIR-12ワークショップへ査読
なしの論文投稿,および 2) NTCIR-12ワークショップ(2016年
6月開催)への参加が求められますので留意ください.

=== 運営者 ===

山本 岳洋(京都大学)
Yiqun Liu, Tsinghua University
Min Zhang, Tsinghua University
Zhicheng Dou, Renmin University of China
Ke Zhou, Yahoo! Labs
Ilya Markov, University of Amsterdam
加藤 誠(京都大学)
大島 裕明(京都大学)
藤田 澄男(Yahoo! Japan)


=== 問い合わせ先 ===

質問がございましたら下記にご連絡ください.

imine2-organizers [at] dl.kuis.kyoto-u.ac.jp
(日英を問わず,お気軽にお問い合わせください.)

=== リンク ===

IMine-2ホームページ:
http://www.dl.kuis.kyoto-u.ac.jp/imine2/

IMineホームページ:
http://thuir.org/IMine/

NTCIR-12:
http://research.nii.ac.jp/ntcir/ntcir-12/

IMine-2ではこれまで以上に,実際の検索エンジンに求め
られる技術と密接に関連したタスクとなっております.
参加をご検討いただければ幸いです.

-- 
Takehiro Yamamoto, Assistant Professor
Department of Social Informatics,
Graduate School of Informatics, Kyoto University
Email: tyamamot [at] dl.kuis.kyoto-u.ac.jp
Tel: 075-753-5702
http://rerank-lab.org/