日本データベース学会

dbjapanメーリングリストアーカイブ(2016年)

[dbjapan] 情報処理学会 第228回自然言語処理研究会(9/29 開始時間訂正)


データベース学会の皆様,

大阪大学の荒瀬です.
先日お知らせいたしました第228回自然言語処理研究会の参加募集について,
9/29の開始時間に誤りがございました.
大変失礼いたしました.

正しいスケジュールを記載した参加募集をお送りいたします.
どうぞよろしくお願いいたします.

荒瀬由紀

---
情報処理学会 第228回自然言語処理研究会 参加募集
https://nl-ipsj.or.jp

============================
 開催概要

●日程: 2016年9月29日(木), 30日(金)

●会場: 大阪大学吹田キャンパス 銀杏会館(大会議室(会議室D/E))
〒565-0871 大阪府吹田市山田丘2-2
http://www.office.med.osaka-u.ac.jp/icho/icho-jp.html
アクセスマップ: https://goo.gl/3WzaEW
(大阪モノレール阪大病院前駅から徒歩7分,
阪急・近鉄バス阪大本部前から徒歩4分)

============================
 懇親会

当日は懇親会を予定しておりますので,ぜひご参加ください.
参加申し込み:https://goo.gl/forms/0TBmCDiDFc9BTMdh1
(会場の都合上、9月26日までにお申込み下さい.27日以降のキャンセルは
参加費をいただきますのでご注意ください.)

・日時:2016年9月29日(月)18時00分
・会場:サルヴァトーレ クオモ アンド バール
(http://www.salvatore.jp/restaurant/senrichuo/)
・事前申込:https://goo.gl/forms/0TBmCDiDFc9BTMdh1
・申込締切:2016年9月26日(月)
・会費:3500円
============================
 照会先

荒瀬由紀(大阪大学)
E-mail: arase (at) ist.osaka-u.ac.jp

============================
 プログラム(発表件数12件)

9月29日(木)14:00-16:50
 [14:00-15:30] 評価と分析      [3件]
 [15:30-15:50] 休憩
 [15:50-16:50] UIとNLP       [2件]
 [18:00-]    懇親会

9月30日(金)10:30-16:30
 [10:30-12:00] 基礎解析       [3件]
 [12:00-13:30] 休憩                 
 [13:30-14:30] 招待講演         [1件]
 [14:30-14:45] 休憩
 [14:45-16:15] 深層学習とNLP    [3件]  
 [16:15-16:30] クロージング

----------
9月29日(木)

[14:00-15:30] 評価と分析 [3件]

(01)酒井 哲也, Zeng Zhaohao (早稲田大学), Luo Cheng (Tsinghua University/早
稲田大学)
Evaluating Helpdesk Dialogues: Initial Considerations from An Information
Access Perspective

Whenever a user of a commercial product or a service encounters a problem,
an effective and efficient way to
solve it might be to contact the helpdesk. In the present study, we address
the problem of evaluating textual
dialogues between the customer and the helpdesk, such as those that take the
form of online chats. Successful
dialogues are desirable both for the customer and for the company that sells
the product/service. We are planning
to build a Chinese helpdesk dialogue test collection (with English
translations) and a suite of language-independent
evaluation measures for quantifying the success of each dialogue.
Establishing reliable automatic evaluation measures
for helpdesk dialogues should enable researchers and engineers to build and
tune intelligent helpdesk software.
This paper reports on our initial step towards this direction to seek
feedback from the natural language processing
research community in Japan.

(02)深澤 祐援 (株式会社クックパッド/東京大学), 原島 純 (株式会社クックパッ
ド)
料理レシピサービスにおける検索語の意味変化に関する分析

我々の毎日の食事について, その傾向を分析するためにこれまで様々な研究が行われ
てきている. こうした研究の多くは
アンケートやインタビューによる分析を行っている. これに対して, 本研究では料理
レシピサービスであるクックパッド内
に蓄積された検索ログによる分析を行なった. 具体的には, 検索ログの共起語ネット
ワークに対する表現学習によって各語に
関する分散表現を獲得し, 2015年9月を起点としてどれだけの意味変化が生じている
のかを分析した. 分析の結果, 味覚表現
に関する単語が最も意味変化が大きく, 加工食品に関する検索語の意味変化が最も小
さいことなどがわかった.

(03)佐藤 貴之 (首都大学東京/クックパッド株式会社), 原島 純 (クックパッド株式
会社), 小町 守 (首都大学東京)
レシピに対する日英機械翻訳の誤り分析

インターネット上で取得可能なレシピが増加するにつれ,レシピの解析や検索,要
約,推薦など,レシピを対象とした
研究も増加している.レシピを対象とした様々な研究がある中,これまでに研究され
ていないトピックとして機械翻訳がある.
食文化の多様化とともにレシピの需要も国際的に拡大しており,機械翻訳はその需要
に応える手段の一つであると考えられる.
そこで,本研究ではレシピの機械翻訳に取り組み,その誤りを分析した.具体的に
は,多くのレシピを抱えるクックパッドの
日本語のレシピを,多くの使用者がいる英語に翻訳することを試みた.そして,翻訳
結果における誤りを分類・分析し,それら
の誤りにどのように対処すべきかを検討した.

[15:30-15:50] 休憩

[15:50-16:50] UIとNLP [2件]

(04)松山 宏樹 (秀明大学), 岡田 勇 (創価大学), 宮粼 瑞之 (秀明大学),
L.Miyazaki Dawn (早稲田大学), 横山 晶一 (山形大学),
 江原 暉将 (江原自然言語処理研究室), 宮澤 信一郎 (秀明大学)
ウェブページ・インターフェース翻訳の技術課題

機械翻訳技術の向上に伴い、よりシームレスな自動翻訳システムに対するニーズが高
まってきた。異なる言語を用いても
スムーズにコミュニケーションするためには機械翻訳技術だけでなく、コミュニケー
ションを行う主体間のインターフェース
にも適切な翻訳技術が用いられる必要がある。しかし、このようなインターフェース
翻訳はこれまであまり注目されていない。
我々はウェブページ・インターフェースを取り上げ、克服すべき技術課題の探索を
行った。そのためウェブページで標準的に
使用されている文法を中心に検討し、標準テスト項目を策定した。これを用いて商業
的に機械翻訳を提供している主要9つのサイト
に対し人手評価を行った。この結果、技術的課題を5カテゴリに集約させることがで
きた。ウェブページ・インターフェース
翻訳の主たる技術課題としては、異なるフォーマットとして記録されているデータの
中に埋め込まれた文字情報の復元化が挙げられ、
また技術的に可能な属性についてサイト別に評価し、翻訳再現率といった指標を提示
することが有効であることが分かった。

(05)小池 誠 (小池誠マイクロ波研究所)
音声対話システムの斬新な出力インタフェース

音声対話システムの出力インタフェースとしては、通常、スピーカーから音声が出力
される。本稿は、音声対話システムの
出力インタフェースとして、マイクロ波聴覚刺激を応用した無線通信が音声を伝える
方式を提案する。この無線通信は、基本的には、
音声信号により振幅変調した後、更にパルス変調するものである。マイクロ波聴覚刺
激により頭部が復調器として機能し、頭の中から
声が聞こえるという状態を誘発することができる。

9月30日(金)
[10:30-12:00] 基礎解析 [3件]

(06)寺内 賢志, 佐々木 稔, 古宮 嘉那子, 新納 浩幸 (茨城大学)
擬似用例を追加する能動学習を用いた一般単語の語義曖昧性解消

語義曖昧性解消において、教師あり学習に用いる訓練データすべてに人手でラベルを
付けていくためには膨大なコストがかかる。
そのため、能動学習によってコストを削減する研究が行われている。先行研究では、
分類器により負例と判定されたデータのみを
訓練データとして追加する能動学習を用いて、固有名詞を対象とした語義曖昧性解消
を行っている。先行手法は固有名詞に対しては
良い結果が得られるが、一般単語に対して識別精度が低いという問題点がある。そこ
で本論文では、一般単語に対する語義曖昧性
解消のための能動学習手法を提案する。提案手法では、分類器により負例と判定され
たデータのみでなく、正例と判定されたデータも
訓練データとして追加する能動学習を用いて語義曖昧性解消を行う。提案手法での実
験を行った結果、既存手法に比べ一般単語に
対する識別精度が向上した。

(07)鈴木 雅也, 古宮 嘉那子 (茨城大学), 岩倉 友哉 (富士通研究所), 佐々木 稔,
新納 浩幸 (茨城大学)
固有表現抽出におけるアノテーション手法の比較

本稿では,非専門家による固有表現抽出のタスクとしてのアノテーションを題材に,次
の2つのアノテーション手法について比較を行った.
1つ目は,既存の固有表現抽出器によるアノテーション結果に対し,人手で修正を行う
手法である.2つ目は,既存の固有表現抽出器を
使用せず,人手でアノテーションを行う手法である.実験では,1テキストに対し,2人の
アノテータを割り当て,それぞれの手法で
アノテーションを行わせた.そして,アノテーションにかかる時間,タグの一致率,及
び,Gold Standardとの比較による正解率の各指標について,
平均値とどちらか一方でも正解のタグを付与しているならば正解とみなした場合の数
値を算出した.本実験の結果から,全体的に見たとき,
既存のアノテーション結果を用いた手法は,アノテーションにかかる時間が少なく,一
致率や正解率についても高い値になることがわかった.
しかし,訓練事例から離れたジャンルのテキストについては,既存の固有表現抽出器を
用いない手法の方が良い結果を出しており,このような
テキストについては,既存の固有表現抽出器を用いず,人手のみでアノテーションを
行った方が良いと考えられる.

(08)尾崎 竜史, 一杉 裕志 (産業技術総合研究所)
範疇文法の構文解析についての圏論的な視点

双閉モノイド圏(biclosed monoidal category) を紹介し,これが古典的な範疇文法
のモデルとなることを説明する.また,このモデルでは
古典的な範疇文法においてad hoc に導入されていた文法範疇の同値性ルールの一つ
が自然同値として構成されることを示す.また,単一の
文に対して同じ意味を与えるような二通りの構文解析が可能な現象を,双閉モノイド
圏における図式の可換性として捉えることを提案する.
最後に,組み合わせ範疇文法への拡張を簡単に検討する.

[12:00-13:30] 休憩

[13:30-14:30] 招待講演
(09)中野 珠実 (大阪大学大学院生命機能研究科)
瞬きから探る脳の情報分節化機構

我々ヒトはおよそ3秒に1回の割合で瞬きをしている。眼球湿潤のためには20秒に1回
ほどで十分なことから、何のために頻回に瞬きをしているのか、
長年の謎であった。映像観察時に瞬きをしているタイミングを調べたところ、人々の
瞬きが、映像の非明示的な情報の切れ目で同期して生じている
ことが明らかとなった。さらに、この瞬きに伴い、脳の中では、内的な処理に関わる
デフォルト・モード・ネットワークの活動が一過性に上昇し、
同時に外界へ注意を向ける注意制御の神経ネットワークの活動が低下していた。つま
り、瞬きは、拮抗する神経ネットワークの活動を一過性に
スイッチすることで、情報を分節化して脳内に取り込んでいると考えられる。
では、瞬きを介して情報の分節を人々は共有することができるのだろうか。そこで、
対面会話時に、話者の瞬きに対して、聞き手の瞬きが同期して
発生するかを調べた。すると、話の切れ目で生じた話者の瞬きに対し、聞き手の瞬き
が同期して発生していた。このような話の切れ目での瞬きの同期は、
コミュニケーションの障害が主症状の自閉症スペクトラム障害では生じなかった。つ
まり、対面会話時の瞬き同期は、情報の分節を無意識に二者間
で共有できているかを客観的に表しており、この情報の分節の共有化が円滑なコミュ
ニケーションには重要であることがわかる。

[14:30-14:45] 休憩

[14:45-16:15] 深層学習とNLP[3件]

(10)加藤 玲大, 馬 青 (龍谷大学), 村田 真樹 (鳥取大学)
深層学習を用いたQAサイト質問文のカテゴリ分類

本稿は,深層学習の手法であるDeep Belief Network (DBN),Stacked Denoising
Autoencoder (SdA)を用いて,QAサイトに投稿された
質問文のカテゴリ分類について述べる.カテゴリ分類におけるDBNとSdAの有効性を確
認するため,多層パーセプトロン(MLP),サポート
ベクターマシン(SVM)をベースライン手法とし,分類精度の比較を行った.次元数の
異なる入力データを2種類用意し,入力の次元数の
違いにおける分類精度の比較を行った.機械学習手法のパラメータの最適化にはグ
リッドサーチを行うことにより決定した.実験の結果,
SdAが最も精度が高かった.また,入力が高次元の時,DBN,SdAともに分類精度が
ベースライン手法より高かった.さらに,入力の次元数
を増やすことが深層学習の精度の向上に有効であることが確認できた.

(11)池田 大志, 進藤 裕之, 松本 裕治 (奈良先端科学技術大学院大学)
Encoder-Decoderモデルを用いた日本語崩れ表記の正規化

近年,ソーシャルメディアの普及に伴い,ウェブ上には人々が投稿した膨大な量のテ
キストデータが存在するようになった.それに伴い,
評価極性分析や話題抽出などの需要が高まり,ウェブ上のテキストデータは重要な言
語資源であると考えられている.しかし,新聞記事
データを用いて訓練した形態素解析器では,口語表現や表記揺れなどを多く含むウェ
ブ上のテキストに対して,形態素解析誤りを起こす
問題がある.そのため,崩れ表記を含む文を正規化することで,形態素解析誤りを削
減することができると考えられる.本研究では,
ニューラルネットワークに基づくEncoder-decoderモデルを用いた日本語崩れ表記の
正規化手法を提案する.また,擬似崩れ表記データ
を用いて正規化に適用した実験結果についても報告する.

(12)佐藤 貴俊, 高村 大也, 奥村 学 (東京工業大学)
分散表現を用いた単語の感情極性抽出

単語の感情極性抽出における分散表現の有効な利用方法を検証する。提案手法では、
単語の分散表現を使って分類器を学習することで、
約90%の正解率で単語の感情極性を判定することができた。学習した分類器は、分散
表現を有するあらゆる単語に適用可能であり、
Wikipedia中のすべての単語に対して感情極性を付与することで、既存のものと比較
して非常に大規模な単語の感情極性リストを構築した。

[16:15-16:30] クロージング

----------

※自然言語処理研究会に登録されている方
研究報告は研究発表会の1週間前に電子図書館と当日閲覧用サイトで公開
します.当日は資料をプリントアウトしてご持参いただくか,ご自身の
PCにダウンロードのうえ,ご持参ください.

情報処理学会電子図書館(情報学広場)
https://ipsj.ixsq.nii.ac.jp/ej/ (ユーザ登録が必要です)
当日閲覧用サイト
http://www.ipsj.or.jp/sig-reports/

※自然言語処理研究会に登録されていない方
当日受付で本研究発表会の資料閲覧用にUSBメモリを貸し出します.
当日はノートPC等をご持参ください.なお,当研究会にご登録頂くことで,
本研究会の資料をバックナンバーも含めて電子図書館で購読できます.
登録されていない方は,是非この機会に研究会に登録してください
(登録まで最大3日かかりますのでご留意ください).

★研究会への登録をお勧めします
年に2回以上の参加を見込まれる方は,研究会に登録される方が(ほぼ)
お得になります.研究会登録は以下のウェブサイトから行えます.
http://www.ipsj.or.jp/kenkyukai/toroku.html

============================
 研究会幹事団
 主査:
   乾健太郎 (東北大学)
 幹事:
   荒瀬由紀 (大阪大学)
   岡崎直観 (東北大学)
   木村俊也 (株式会社ミクシィ)
   小町守  (首都大学東京)
   西川仁  (東京工業大学)
 運営委員:
   浅原正幸 (国立国語研究所)
   荒牧英治 (奈良先端科学技術大学院大学)
   石野亜耶 (広島経済大学)
   金丸敏幸 (京都大学)
   小林隼人 (Yahoo! JAPAN 研究所)
   古宮嘉那子(茨城大学)
   貞光九月 (日本電信電話株式会社)
   佐藤敏紀 (LINE株式会社)
   新里圭司 (株式会社楽天)
   鈴木祥子 (日本アイ・ビー・エム株式会社)
   数原良彦 (リクルートホールディングス)
   高村大也 (東京工業大学)
   土田正明 (日本電気株式会社)
   堂坂浩二 (秋田県立大学)
   徳永拓之 (スマートニュース株式会社)
   二宮崇  (愛媛大学)
   橋本力  (独立行政法人 情報通信機構)
   藤田早苗 (日本電信電話株式会社)
   牧野貴樹 (グーグル株式会社)
   牧野拓哉 (株式会社富士通研究所)
   松崎拓也 (名古屋大学)
   ミハウ・プタシンスキ(北見工業大学)
   村脇有吾 (京都大学)
   若木裕美 (株式会社東芝)
   Kevin Duh (Johns Hopkins University)
============================