で、一応結果…1-gramのみ。
kakasiとmorogramとその他。の続きです。
いうんしかとてなのはにすたでき、くっまがるもこつ。じれりーょだおをあらけよさど「」ちせそゅ…ふめえみわほひやばろゆびずねげごむぶゃへぎ・べぼぜぷざぞぱぐづぽ!ぺ?ぇぁぴぉぃぬ&ぢ()ぅ%〜
ぱっと見た感想は…
- とにかく「…」が多い。
「ぅ」が一文字もない。「〜」も一文字もない。…って、配列定義をベタ張りしてるから、ゼロって事はあり得ないよな…。単なる置換ミスだったらしいorz- 句読点は読点のシフト側にした方が良いんじゃねーの?という感じがした。
- 絶対に飛鳥で打ちやすいキーに引っ張られていると思う(注:主観)。
2-gram以降はどこかにリストを載せておいた方が良いのだろうか…?
とりあえずは6-gramの出力が終わった時点で寝ます。
7-gramを見てようやく気づいた。
kakasiの変換結果が、「姫踊子草」→「ひめようこくさ」になっていますorz
カナ→かな変換もkakasiで出来るそうです。
詳しくはコメント欄をご覧下さい。
Uジローさん、お教えいただきありがとうございます!
上にも追記しておきました。
2005/05/22追記。
分かち書き時は--wオプションが必要
…って、単語単位解析は微妙なので、とりあえずはキャンセル。