研究テーマ
当研究室では自然言語処理に関する以下のような研究に取り組んでいます。
基礎研究
- コーパスに基づく自然言語理解
自然言語理解とは、コンピュータに文やテキストの意味を理解させる技術です。文の意味の理解するためには膨大な知識が必要です。そのための知識をコーパスと呼ばれる大量のテキストデータから自動的に獲得します。
- 語義曖昧性解消
一般に単語は複数の意味を持っています。語義曖昧性解消とは、文中の単語の意味を理解する技術です。例えば、『パイプが壊れて水があふれた』の「パイプ」の意味はキセルなのか水道管なのかを決定します。
- 新しい単語の意味の発見
単語の新しい意味や用法は日々生まれています。既存の辞書に頼らずに、大量のテキストから単語の意味を自動的に発見する手法の開発に取り組んでいます。
応用研究
- 評判情報分析
ウェブ上の製品やレストランなどのレビューを自動的に解析し、ユーザにとって有益な情報を提供します。文が肯定的あるいは否定的な見解を示しているかを自動的に判定し、賛成意見・反対意見のまとめを作成したり、それぞれの意見の件数を提示します。
- ウェブアクセス支援
ウェブには膨大な情報がある一方、自分の知りたい情報を探し出すのは大変です。ウェブから効率良く情報を検索・獲得する様々な研究に取り組んでいます。例えば、病気のことを調べるときは医師が書いたウェブページが参考になりますが、ウェブ検索の結果をウェブページの作成者のプロフィールとともに提示することで、信頼できる情報を見つけやすくします。
- 質問応答システム
質問応答システムとは、自然言語による質問文を入力し、その回答を大量のテキストから自動的に発見するシステムです。例えば、曖昧な質問が入力されたとき、システムの方から問い返しを行い、正確な回答を返す研究に取り組んでいます。すなわち、「ワールドカップの優勝国は何ですか?」という質問に対し、「種目は何ですか?」「何年のワールドカップですか?」といった問い返しを行い、ユーザの返答に応じて元の質問文に対する回答を探索します。