で、一応結果…1-gramのみ。

kakasiとmorogramとその他。の続きです。

いうんしかとてなのはにすたでき、くっまがるもこつ。じれりーょだおをあらけよさど「」ちせそゅ…ふめえみわほひやばろゆびずねげごむぶゃへぎ・べぼぜぷざぞぱぐづぽ!ぺ?ぇぁぴぉぃぬ&ぢ()ぅ%〜

 ぱっと見た感想は…

  • とにかく「…」が多い。
  • 「ぅ」が一文字もない。「〜」も一文字もない。…って、配列定義をベタ張りしてるから、ゼロって事はあり得ないよな…。単なる置換ミスだったらしいorz
  • 句読点は読点のシフト側にした方が良いんじゃねーの?という感じがした。
  • 絶対に飛鳥で打ちやすいキーに引っ張られていると思う(注:主観)。


 2-gram以降はどこかにリストを載せておいた方が良いのだろうか…?
 とりあえずは6-gramの出力が終わった時点で寝ます。

7-gramを見てようやく気づいた。

 kakasiの変換結果が、「姫踊子草」→「ひめようこくさ」になっていますorz

カナ→かな変換もkakasiで出来るそうです。

 詳しくはコメント欄をご覧下さい。
 Uジローさん、お教えいただきありがとうございます!
 上にも追記しておきました。

2005/05/22追記。

 分かち書き時は--wオプションが必要
 …って、単語単位解析は微妙なので、とりあえずはキャンセル。