Message-Id: <199710061124.UAA04724@wise19.mn.waseda.ac.jp> To: Canna@nec.co.jp cc: g92k0323@mn.waseda.ac.jp Date: Mon, 06 Oct 1997 20:23:59 +0900 From: KANOU Hiroki Reply-To: Canna@nec.co.jp X-Distribute: distribute [version 2.1 (Alpha) patchlevel=19] X-Sequence: Canna 5015 Subject: [Canna 5015] #KS,#sxi -- #BM or #BB? Errors-To: Canna-request@nec.co.jp Sender: Canna-request@nec.co.jp 狩野@わせだです。 これが、[Canna 4997] の藤枝さんのパッチへの最後のメールです。 >** 一段動詞/サ変の未然形を文章末指定 >「い(#KS)」「み(#KS)」「し(#sxi)」一文字で文節が切れることがあるので、 >#KS、#sxiは文章末でのみ文節になれるように指定した。 ですが、ちょっと副作用が大きすぎるのではないかと思います。 #未然形というより連用形ですよね:-)。 一段動詞には名詞として使うかどうかで #KS と #KSr の区別がありますが、 名詞に転成しない方である #KS も、複合語として使うのはいっぱいあるん ですね。今までは、次に来るのが名詞だからその前で文節が切れ、うまく いっていたのが、この変更で出なくなってしまった物はいっぱいあります。 「区知己」とか「四日目面(number.t 使用時)」とか「出刃名をくじかれる」 とか「者画れ声」「生獣」「店場」「八つ毛四語と(number.t 使用時)」は いくらやっても学習しません。「い」「み」「し」が出て来る不便さは、 これに比べれば「倉部模のにならない」のではないかと思います。 #「出てく琉不便さは」になるのが気持ち悪い。 ところが、「優れ物」はちゃんと出て来るのが実に不思議…。chkconc で 確かめても #KS は文章末にしか接続しないはずなのに? 単語として確立している複合語や複合動詞なら、片っ端から登録してやれば いいのですが、「○○改め××」や「隠れ□□ファン」「それに加え△△も…」 というような表現は単語ではないので、文法的に手当をしてやる必要があります。 他にも、補助用言「だす」が続いたときとか、けっこう悲惨な変換結果が出て 悲しいです。 対策はいくつか考えているのですが、アルゴリズムをまだ理解していない (場合によっては #KS で切れることもあるのはなぜ?)ので、まずはその解説を 先にお願いしたいのですが…>藤枝さん。 P.S. 3品詞パッチって、何か凄そうですね。 狩野 宏樹 g92k0323@mn.waseda.ac.jp