{つ|く|っ}のばらけ具合について。@雑記/えもじな〜内。
morogramでカウントした結果から、末尾に{つ|く|っ}が付くものをそれぞれ選別して、並べ替えしてみました(ホントは一発で出せるはずなのですが、どうやるのか解らんのです)。
こんな感じのコマンドを使って1〜23gramのファイル全てを対象にしてます。
for %f in (*.*) do jgawk '/っ\t/ {print $0}' < %f > %f.ltu for %f in (*.*) do jgawk '/つ\t/ {print $0}' < %f > %f.tu for %f in (*.*) do jgawk '/く\t/ {print $0}' < %f > %f.ku
文字数2字、出現頻度100回以上ではこんな感じです。
1346 れつ 1039 ょく 567 かく 555 いっ 543 につ 538 かっ 476 なっ 475 なく 420 まっ 393 もっ 381 をつ 367 けっ 344 っく 338 がつ 319 とく 295 たく 294 あっ 260 うつ 256 そく 254 さく 253 つく 248 とっ 245 …っ 243 じつ 228 ぞく 226 ゃく 225 ひつ 225 こく 216 すく 216 いく 212 てく 208 やく 203 だっ 203 おく 200 いつ 193 しく 192 せっ 191 」っ 188 はっ 187 せつ 184 じっ 183 んく 174 かつ 168 ゅつ 165 やっ 163 とつ 158 らっ 157 らく 157 がっ 152 ちく 151 しつ 145 たっ 143 だく 143 しっ 143 はつ 142 うっ 139 くっ 135 りっ 133 。つ 131 はく 131 がく 130 よく 126 ばっ 118 りつ 114 ふく 111 つつ 108 べつ 105 、つ 103 れっ 102 っっ
文字数3字、出現頻度30回以上ではこんな感じです。
1315 いれつ 727 りょく 257 になっ 194 つかっ 193 しまっ 186 きょく 183 うこく 168 おもっ 143 んぞく 138 、けっ 129 なかっ 125 はなく 118 んにつ 109 ひとつ 108 にとっ 100 ばっく 100 おおく 98 ううつ 97 いっっ 91 じゅつ 89 つくっ 86 くなっ 86 。…っ 85 りんく 83 んかく 82 ぎゃく 82 んさく 81 があっ 81 であっ 81 ったく 80 とらっ 79 となっ 78 らっく 78 くなく 78 くばっ 77 をつく 76 しゅつ 75 といっ 73 うはく 66 しょく 66 ちょっ 65 ちがっ 64 んたく 63 るいく 63 りゃく 61 してく 59 うやく 59 んがつ 58 ちょく 57 にかく 56 によっ 53 ってく 53 めりっ 53 をもっ 52 きそく 52 るひつ 50 となく 48 んだく 48 いにつ 47 んじつ 47 これっ 47 はやく 46 しつつ 45 、じっ 45 はまっ 45 をかく 44 をふく 44 うにつ 44 たたく 43 んそく 43 っとく 42 いなく 42 をいっ 42 いかく 41 かわっ 41 すいっ 41 いけつ 41 うまく 41 きろく 40 ういつ 40 もしく 39 つをつ 38 だしく 38 んをつ 37 んまつ 36 うとく 36 。もっ 36 す。つ 36 してつ 36 いせつ 35 んしつ 35 かえっ 35 ひかく 35 いはつ 34 やすく 34 。はっ 33 うろく 33 んどく 33 かかっ 33 しゅく 32 んかつ 32 うやっ 32 りっく 32 はいっ 32 らんく 32 うそく 32 、かつ 31 にひつ 31 んとく 31 とにつ 31 。けっ 30 よかっ 30 る」っ 30 こまっ 30 にいっ