フリーで入手可能な日本語の形態素解析エンジンに関するメモ。
注:wikipedia「形態素解析」より。
- KAKASI(kanji kana simple inverter)、kakasi.namazu.org
- MeCab(和布蕪)、cl.aist-nara.ac.jp (http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/)
- ChaSen(茶筌)、chasen.aist-nara.ac.jp
- Juman、pine.kuee.kyoto-u.ac.jp (http://pine.kuee.kyoto-u.ac.jp/nl-resource/juman.html)
- すもも、www.t.onlab.ntt.co.jp (http://www.t.onlab.ntt.co.jp/sumomo/)
- Breakfast、www.labs.fujitsu.com
ええと…まだ試してないものがたくさんありますね(汗
うーん…使用条件を確認しないとダメなものはBreakfastだけかな?
しかし、人によって文字の使い方に特徴が出る部分って結構あるんですね…。
その辺も「キー配列との相性(あるいは、キー配列に引きずられている部分)」があるのかなぁ…。
うまくいったら…
かつての文書バックアップを入力方式別に掛けてみる。
3〜4字の頻度が肝か。
特に、「小書き文字を含む文字列をすばやく打てること」にフォーカスしたカナ配列があってもいいのでは?という気も…難しいだろうけど。