
ことばを理解するコンピュータ
白井研究室 SHIRAI Laboratory
准教授:白井 清昭(SHIRAI Kiyoaki)
E-mail:
[研究分野]
自然言語処理、機械学習、知識獲得、人工知能
[キーワード]
統計的自然言語解析、ウェブアクセス支援、自然言語処理応用システム
研究を始めるのに必要な知識・能力
言語に関する関心、自然言語処理に関する研究を究めようとする向学心、アルゴリズム・オートマトンに関する基礎知識。
この研究で身につく能力
当研究室では自然言語処理を主な研究テーマとしています。まず、自然言語処理に関連する過去の研究を調査し、未解決の問題を発見し、それを整理して研究テーマとして設定する能力を養います。指導教員からの助言をもとに進めることになりますが、特に博士後期課程の学生は問題を主体的に発見することに取り組みます。次に、研究テーマの課題の解決方法を探究する能力を養います。重要な問題は何かを見極め、それらの問題解決に必要な言語処理技術や方法を発見します。最後に、得られた成果を論文としてまとめる能力やプレゼンテーション能力を養います。学位論文の執筆や学内・学外での研究発表を通じてその能力を磨きます。
【就職先企業・職種】 IT産業、情報システム開発
研究内容
自然言語処理とは、我々が日常使っていることばをコンピュータに理解させ、それを加工したり新しいサービスを提供する技術です。自然言語処理は我々の生活をより豊かにする大きな可能性を秘めていますが、一方でコンピュータに言語を理解させることは大変難しいことでもあります。我々の研究室ではこの困難な課題に積極的にチャレンジしています。
当研究室における主な研究テーマは以下の通りです。
(1)大量のテキストに基づく自然言語解析
自然言語解析とは文の意味をコンピュータに理解させる処理を指します。文の意味を正しく理解するためには多くの知識や規則が必要です。一方、言語で使われる表現は実に多様であり、様々な文を正しく解析できる知識や規則を網羅的に用意することは困難です。当研究室では、大量のテキストから得られる統計的知識を利用することで様々な文を正確に解析する技術を研究しています。
(2)ウェブアクセス支援
ウェブアクセス支援とは人間によるウェブ検索をサポートする技術です。対話型質問応答システムはその一例です(左図)。質問応答システムとは、「ワールドカップの優勝国はどこですか?」といった質問に対し、その回答をウェブから検索し、答えるシステムです。ところが、ユーザから入力された質問の意味が曖昧なために正しい回答がわからない場合があります。先ほどの質問の場合、ワールドカップの種目(サッカー、ラグビー、バレーボール)や開催年によって回答は異なります。そこで、システムからユーザに対して「ワールドカップの種目は何ですか」「何年のワールドカップですか」といった問い返しを行い、その返答によって正しい回答を絞り込みます。
(3)評判情報検索
近年、多くの人がウェブ上のブログやSNSに製品やサービスの評判を書き込んでいます。このような他者による評判は、製品の購入やサービスの提供を受けることを検討している人にとって有益です。評判情報分析とは、ユーザによるレビュー文を解析し、それが肯定的な意見か否定的な意見かを自動的に判定し、またその解析結果を集約して、製品やサービスに関する世間の評判を自動的に解析する技術です。
(4)自然言語処理応用システム

主な研究業績
- Aye Aye Mar, Kiyoaki Shirai. Automatic Construction of Annotated Corpus with Implicit Aspect. The Thirteenth Edition of the Language Resources and Evaluation Conference, pp. 6985-6991, 2022.
- Shangzhuang Han, Kiyoaki Shirai. Unsupervised Word Sense Disambiguation based on Word Embedding and Collocation. The 13th International Conference on Agents and Artificial Intelligence, Volume 2, pp.1218-1225, 2021.
- Kiyoaki Shirai, Yunmin Xiang. Over-sampling Methods for Polarity Classification of Imbalanced Microblog Texts. The 33rd Pacific Asia Conference on Language, Information and Computation, pp.248-256, 2019.
研究室の指導方針
本研究室では、自然言語処理を研究テーマとしていますが、他のテーマにも応用できる一般的な問題発見能力、問題解決能力、プ レゼンテーション能力を高めることを目指しています。これらの能力を高めるため、輪講( 過去の文献の内容を発表して情報を交換する会)、ゼミ( 自身の研究を発表してその内容を議論する会) を実施しています。また、指導教員と学生の研究打ち合わせを適宜行い、助言を与えつつ、研究課題を解決する手法を自力で発見することを促します。
[研究室HP] URL:https://www.jaist.ac.jp/nlp/lab/index.php?Top