人工知能領域【島津研究室】
■研究対象
当研究室は自然言語処理と呼ばれる分野の研究を行っています。自然言語とは,日本語,英語など,人間が日常用いている言葉です。
■自然言語処理
自然言語処理の研究対象には基本技術と応用技術があります。
以下は基本技術です。
| a ) |
文を語に分け,語の品詞付けをする形態素解析 |
| b ) |
文を構成する語句とそれらがどのように結びついているか調べる構文解析 |
| c ) |
文が表す意味を解析する意味解析 |
| d ) |
文章中の省略語句を補完したり,代名詞が何を指しているか解析する文脈解析 |
| e ) |
一続きの文がどのように関係して文章を構成しているか調べる談話解析 |
| f ) |
意味情報を文章に変換する文生成 |
| g ) |
言語情報を画像や動画に変換する技術 |
| h ) |
語の集合を類似した語の集まりに分けるクラスタリング |
| i ) |
語が他の語とどのように結び付くかなどを表す語彙モデル |
| j ) |
語の情報を効率的に表現し,語に高速にアクセスできるようにする辞書技術 |
| k ) |
大量の電子化テキストおよび機械学習を利用して,形態素解析,構文解析などを行う統計言語処理 |
| 以下は主な応用システムです。 |
| l ) |
異なる言語の文章を変換する機械翻訳 |
| m ) |
人間と言葉で会話する対話システム |
| n ) |
大量文書に対する情報検索や質問応答 |
| o ) |
文章の要約や情報抽出 |
■研究の性質
自然言語処理は技術や応用の面からみると工学です。一方,言葉は人間が生み出すもので,様々な言語現象があります。そのような言語を計算機で扱うためには,多様な言語現象を観察,分析して,現象を説明する原理やモデルを見出し,技術として具体化しなければなりません。観察や分析をしてモデル化する面はサイエンスと言えます。
■研究課題
言語コミュニケーション:人間の話し言葉による説明対話を観察分析し,情報を動的に説明するモデルを研究します(JAISTAR vol. 2,自然言語処理)。
統計モデルに基づく言語処理:大量の言語データと機械学習により,語義曖昧性解消,意味解析,機械翻訳などについて研究します。
法令文書の言語処理:法令は社会の仕様書であるという考えによる法令工学の視点から,法律,組織の規則,契約書等を対象に,法令の整合性の検査,論理式への変換,言い換え等を研究します。
■研究事例
- 法令文の論理表現への変換
- 法令文書の言い換え
- 構文ベースの統計的機械翻訳
- 語義曖昧性の解消
- 言語的意味情報の獲得と検索への適用
- Webページの言語処理(要約、分類等)
- 「AのB」の意味解釈
- テキストが表す世界モデルの抽出
- 発話意図の認識法の研究
- 話し言葉による音声対話システム

■代表的な著書・論文
- 健康診断データの対話的説明システム
- 言語から動画の生成
- M. Nakamura, S. Nobuoka, A. Shimazu. Towards Translation of Legal
Sentences into Logical Forms. New Frontier in Artificial Intelligence,
Vol.4914/2008, pp.349-362, 2008
- T. P. Nguyen, A. Shimazu. Improving Phrase-based Machine Translation
with Morphosyntactic Ttansforma- tion. Machine Translation,
Vol.20, No.3, pp.147-166, 2007
- A.C. Le, A. Shimazu, V. N.. Huynh, Word Sense Disambiguation by Combining
Classifiers with an Adaptive Selection of Context Representation.
Journal of Natural Language Processing, pp. 75-96, 2006