日本データベース学会

確率モデルに基づく自然言語文書からの知識抽出に関する研究

概要PDF

番号 22
氏名 白井 匡人
フリガナ シライ マサト
学位名 博士(工学)
取得大学 法政大学
学位授与日 2016年3月24日
指導教員名 三浦 孝夫
論文題目(主) 確率モデルに基づく自然言語文書からの知識抽出に関する研究
論文題目(副) Studies on Knowledge Extraction based on Probabilistic Model from Natural Language Documents
論文概要等

■ 論文概要
本論文では,潜在要因を考慮した確率モデルに基づき自然言語文書からの知識抽出を行う手法を提案し,主に2つの問題について論じる.すなわち,文書を特徴付ける複数の要因が混在した文書集合からの特徴抽出と特徴の変化が起きる文書ストリームからの特徴抽出である.第1の問題では,トピックモデルにより単語の持つ潜在トピックを推定し,文書を潜在トピックの混合で表す.この潜在トピックを文書を特徴付ける要因と見なすことで,検索語の意味の抽出といった自然言語文書からの知識抽出が行えることを示す.第2の問題では,ストリーム中での文書の特徴を抽出するためにトピックモデルのオンライン学習を行う.文書ストリーム中での特徴の変動を事前分布の変化と対応させることで表現する.また,ストリーム中の文書の特徴の変化を捉えるために定常的な特徴と変動的な特徴をそれぞれ定常トピック,変動トピックとして抽出する.

■ 学位を取得して
博士論文の執筆は今までの研究生活の中で最も大変な作業でした。
辛いこともありましたが、担当教授や他の先生方、研究室の方々の支えで学位を取得することができました。今では博士課程に進学して良かったと思っています。
学位取得までに培った経験を今後の研究に役立てていきたいと思います。

アーカイブ