Development of Japanese Reading Support System on WWW Browser

WWWブラウザを利用した日本語読解支援システム

寺 朱美・北村 達也・落水浩一郎
北陸先端科学技術大学院大学
Japan Advanced Institute of Science and Technology, Hokuriku
tera@jaist.ac.jp, kitamura@jaist.ac.jp, ochimizu@jaist.ac.jp

English Page is here


【要約】
専門的な分野において日本語で研究を進める留学生にとって、日本語の文 章を読むことは必要不可欠であるが、会話に不自由しなくても漢字が障害となって 文章の読解が困難な段階を迎えている学習者が少なくない。そこで、WWWブラウザ を利用して文章を高速で大語彙辞書とリンクさせ、文章の読解を支援するシステム の構築を試みた。本稿では日本語読解支援システムの概要と試験的運用の現状について報告する。

【Abstract】
For the foreign student studying in Japanese, it's nessesary to read and understand the Japanese language. Many stsudents can speak and listen to Japanese well, but can't understand Japanese sentences because of complicated Kanji's meanings. We wanted to develop a system to support Japanese reading and understanding on WWW Browser. In this report we present the developed System and offer some comments on our experience in testing and using the System.

【キーワード】
WWWブラウザ, ハイパーテキスト, 電子化文書, 大語彙辞書, インターネット, 高 速検索


【はじめに】
我々は、日本語学習者が漢字を学習する際の障害をできるだけ軽減させる目的 で、ハイパーテキストを利用した日本語学習支援システムに関する研究を行なって きた。
前研究「漢字学習支援システム」では、漢字の属 性を多面的に学習することだけではなく、日本語文章中の漢字を認識するこ とに重点をおいて、文章中の漢字をその属性情報とリンクさせるシステムの開発 を行なった。その結果、このシステムが文章の読解を支援するものとしても機能し、 これが日本語学習をも促進することがわかった。そこで本研究ではこの機能に的を 絞り研究を行なった。


【問題と目的】
日本の大学に在籍する留学生の場合、日本語の文章を読むことは必要不可欠である。 学習者が日本語の文章から情報を得る際、辞書で単語の意味を調べながら読み進め るが、語彙検索に時間を要しなかなか読解が進まない。文章中の語彙検索が簡単に 行なえるシステムがあれば大きな助けになると思われる。
以上の観点から我々は日本語の文章中の語彙を大語彙辞書とリンクさせ、高速に参 照することを可能にするシステムを開発した。システムはWWWブラウザを通して利 用する。このシステムを利用することにより、日本語の文章のスムーズな読解が可 能になる。

日本人が外国語の文章を読む際も、文法は習得していても知らない語彙が頻繁にで てくると読解に時間がかかる。このシステムの辞書を対応の外国語に置き換えれば、 我々も活用することができる。


【システムの概要】
システムは、 DL とWWWブラウザの2つの部分から成る(図参照)。 DL は日本語の文章と辞書をリンクさせる。WWWブラウザは辞書とリンクさ せたファイルを表示させる。
利用者は電子化文書を DL で処理し、生成したファイルをWWWブラウザを利 用して読解を行なう。

  1. 【 DL 】
    DL は、日本語の文章を形態素解析し、辞書とリンクさせるプログラムであ る。形態素解析はJUMAN(文献参照)により行なう。
    電子化された日本語の文章データに対し DL を実行すると、JUMANにより形 態素解析を行なう。形態素解析された語彙を辞書から検索し、文章中の語彙と辞書 の語彙をリンクさせたファイル(HTML形式)を生成する。
    現在、このシステムでは辞書として EDICTを利用している。EDICT は77,000語を収録した配布可能な辞書である。
    (著者注:現在 EDICT は、"EDICT"と"ENAMDICT"という2つのファイルに分割されている。固有名詞を除く"EDICT"ファイルには、総語彙数58,000語が収録されている。1996年4月30日記)
    DL はJPerl\cite{bunken6}によって記述されているため、さまざまな計算 機環境で利用が可能である。将来的には DL も配布可能なプログラムとする 予定である。

  2. 【WWWブラウザ】
    WWWブラウザはNetscape 2.0を利用する。辞書とリンクしたファイル(HTML形式)を 指定してNetscapeを起ち上げると、図のような画面が現れる。左側は 本文フレーム、右側は辞書フレームとする。
    学習者が本文を読む途中でわからない単語がで出てきた場合、単語をクリックする と読み方及び意味のリストが呼び出される。 WWWブラウザはインターネット上で利用することができるので、このシステムはイ ンターネットを介して利用することができる。


【考察】
学習者はこのシステムを利用することにより、自分で電子メールや新聞記事、専門 分野の論文など身のまわりの日本語の文章を読むことができる。語学学習のみなら ず日本語で書かれた論文やレポートを読む場合もこのシステムを利用することによ り、読解が速く容易に行なわれるようになるだろう。 このシステムは、日本語学習者だけではなく他の外国語を学習をする場面にも応用 が可能である。現在の日英対訳辞書を他の言語の対訳辞書と入れ換えることにより、 利用者が基本的な文法知識を持っていれば、多くの外国語の文章を読解する手助け をしてくれることだろう。


【おわりに】
現在、本学の留学生を対象に、試験的に学内ネットワークニュース、石川県で毎月 配布されている日本語と英語の情報紙「COSMOS」をこのシステムを利用して提供し ている。
何人かの留学生は、専門分野の論文の読解を進めたり、電子メールを読むためにこ のシステムを利用している。
将来的には、辞書を充実し学習者の専門的な学習内容にも対応させたい。また、ど のような語彙が多く検索されるかなどの記録を踏まえ、辞書を精選 したい。


【参考文献】

  1. 寺 朱美, 落水浩一郎, ``ハイパーカードを利用した漢字学習支援システム'',日本 語教育会誌 Vol. 1, No. 3, pp. 36-37 (1994)
  2. 寺 朱美, 桑山正彦, 海谷治彦, 落水浩一郎, ``ハイパーカードを利用した漢字学習支援システム'', 北陸先端科学技術大学院大学 JAIST Research Report (1995)
  3. 松本裕治, 黒橋禎夫, 宇津呂武仁, 妙木裕, 長尾真, ``日本語形態素解析システムJUMAN 使用説明書 version 2.0'', (1994)
    http://www.naklab.dnj.ynu.ac.jp/~hidefumi/manual/main.html
  4. 海保博之, 原田悦子, プロトコル分析入門, 新曜社(1993)
  5. Jim Breen, ``EDICT'', (1995)
    ftp://ftp.cc.monash.edu.au/pub/nihongo/elec_dic.ps.gz,
    ftp://ftp.cc.monash.edu.au/pub/nihongo/ejdic_report1.ps.gz
  6. Larry Wall, Randal L. Schwartz著, 近藤嘉雪訳, ``Perl プログラミング'', ソフトバンク(株), (1995)

DL のページにご案内いたします
JAIST Home Page
Tera's Home Page

Last Updated 6 April 1996 tera@jaist.ac.jp