本文へジャンプ
白井研究室

ことばを理解するコンピュータ

白井研究室 SHIRAI Laboratory
准教授:白井 清昭(SHIRAI Kiyoaki)

E-mail:E-mai
[研究分野]
自然言語処理、機械学習、知識獲得、人工知能
[キーワード]
統計的自然言語解析、ウェブアクセス支援、自然言語処理応用システム

研究を始めるのに必要な知識・能力

言語に関する関心、自然言語処理に関する研究を究めようとする向学心、アルゴリズム・オートマトンに関する基礎知識。

この研究で身につく能力

当研究室では自然言語処理を主な研究テーマとしています。まず、自然言語処理に関連する過去の研究を調査し、未解決の問題を発見し、それを整理して研究テーマとして設定する能力を養います。指導教員からの助言をもとに進めることになりますが、特に博士後期課程の学生は問題を主体的に発見することに取り組みます。次に、研究テーマの課題の解決方法を探究する能力を養います。重要な問題は何かを見極め、それらの問題解決に必要な言語処理技術や方法を発見します。最後に、得られた成果を論文としてまとめる能力やプレゼンテーション能力を養います。学位論文の執筆や学内・学外での研究発表を通じてその能力を磨きます。

【就職先企業・職種】 IT産業、情報システム開発

研究内容

自然言語処理とは、我々が日常使っていることばをコンピュータに理解させ、それを加工したり新しいサービスを提供する技術です。自然言語処理は我々の生活をより豊かにする大きな可能性を秘めていますが、一方でコンピュータに言語を理解させることは大変難しいことでもあります。我々の研究室ではこの困難な課題に積極的にチャレンジしています。

当研究室における主な研究テーマは以下の通りです。

(1)大量のテキストに基づく自然言語解析

自然言語解析とは文の意味をコンピュータに理解させる処理を指します。文の意味を正しく理解するためには多くの知識や規則が必要です。一方、言語で使われる表現は実に多様であり、様々な文を正しく解析できる知識や規則を網羅的に用意することは困難です。当研究室では、大量のテキストから得られる統計的知識を利用することで様々な文を正確に解析する技術を研究しています。

(2)ウェブアクセス支援

ウェブアクセス支援とは人間によるウェブ検索をサポートする技術です。例えば、ウェブ上の情報は常に正しいわけではないため、ユーザが正しい情報か否かを判断することを助ける技術の開発に取り組んでいます。具体的には、ウェブページを書いた人や組織のことを「発信者」と呼び、発信者をウェブページから自動的に取得し、検索結果としてユーザに提示します。病気について調べたいとき、医者が書いたページや病院のページに掲載されている情報は信頼性が高いと言えます。ウェブページの発信者の情報を提示することにより、ユーザは「このページは医者が書いているから正しいだろう」といった推測をすることができ、容易に正しい情報を得ることができるようになります。

(3)評判情報検索

近年、多くの人がウェブ上のブログやソーシャルメディアに製品やサービスの評判を書き込んでいます。このような他者による評判は、製品の購入やサービスの提供を検討している人にとって有益です。評判情報分析は、ユーザによるレビューを解析し、それが肯定的な意見か否定的な意見かを自動的に判定し、またその解析結果を集約して、製品やサービスに関する世間の評判を明らかにする技術です。さらに、レビュー全体ではなく製品の属性に対する意見の肯定・否定を判定することにも取り組んでいます。属性とは、例えば評価対象がスマホのときには「デザイン」「操作性」「バッテリ」といった製品の特徴を指します。属性それぞれに対するユーザの意見を分析することで、製品の評判をより精緻に分析することができます。

(4)自然言語処理応用システム

shirai1.png自然言語処理の技術を用いた様々な応用システムに関する研究に取り組んでいます。例えば、コンピュータとおしゃべり(雑談)を楽しむことのできるチャットシステムを開発しています。また、ある言語を別の言語に翻訳する自動翻訳にも取り組んでいます。特に、方言から標準語への翻訳、手話からテキストへの翻訳など、パラレルコーパス(翻訳例を集めたデータ)の量が少ないときでも正確な翻訳モデルを機械学習する研究に注力しています。

主な研究業績

  1. Aye Aye Mar, Kiyoaki Shirai, Natthawut Kertkeidkachorn. Weakly Supervised Learning Approach for Implicit Aspect Extraction. Information 14(11), 612, 2023.
  2. Daichi Haraguchi, Kiyoaki Shirai, Naoya Inoue, Natthawut Kertkeidkachorn. Discovering Highly Influential Shortcut Reasoning: An Automated Template-Free Approach. Findings of the 2023 Conference on Empirical Methods in Natural Language Processing, pp.6401-6407, 2023.
  3. Tu Dinh Tran, Kiyoaki Shirai, Natthawut Kertkeidkachorn. Text Generation Model Enhanced with Semantic Information in Aspect Category Sentiment Analysis. Findings of the 61st Annual Meeting of the Association for Computational Linguistics, pp.5256-5268, 2023.

研究室の共同専攻における強み

本研究室は自然言語処理について研究をしています。自然言語処理は応用範囲の広い研究分野で、他分野との融合的な研究トピックも数多く存在します。医療テキストを対象にしたマイニングによる新しい医学的知識の発見、言葉によるロボットの制御、画像のキャプション生成、画像に対する質問応答などが例として挙げられます。融合科学共同専攻では、様々な分野の専門家と交流することで、自然言語処理を中心とした学際的な研究に取り組むことができます。

[研究室HP] URL:https://www.jaist.ac.jp/nlp/lab/index.php?Top

ページの先頭へもどる