コーパスとは,新聞記事,雑誌,小説,論文などの 文章を大量に集めた例文集である. 本講義では,このようなコーパスを利用した 自然言語処理技術について学ぶことを目的とする
本講義の主な内容は以下の通りである.
・コーパスを利用した曖昧性解消
自然言語処理における重要な問題のひとつに曖昧性解消,
すなわち複数の解析結果の候補の中から正しい解を選ぶことが挙げられる.
本講義では,コーパスから学習された統計情報を用い,
解析結果の候補に対して優先順位をつけることによって曖昧性を解消する技術を紹介する.
具体例として品詞付け,構文解析,語義の決定などを取り挙げる.
・自然言語処理用知識の自動獲得
文法,シソーラス,格フレーム辞書などの自然言語処理用知識をコーパス
から自動的に獲得する手法を紹介する.
・事例ベースの自然言語処理
事例ベースの自然言語処理とは,解析済みの例文を集めたデータベース
(コーパス)を用意し,解析対象となる入力文と類似した例文をデータベースの
中から検索し,その類似例文の解析例を加工して入力文の解析結果を得る手法である.
本講義では,特に事例ベースの機械翻訳,格解析などを取り挙げる.
1. C.D. Manning and H. Schutze, Foundations of Statistical Natural Language Processing, MIT-press, 1999.
I223「自然言語処理論I」を受講しておくことが望ましい.