……出来上がっていた。
(過去:とりあえずてすとちゅー。 - 雑記/えもじならべあそび)
(過去:(memo)たとえば、「巷に溢れるエロ小説」をOCRにかけて、それのn-gram列を「最も打ちやすい」配列は何か?を計算する、とか。 - 雑記/えもじならべあそび)
どうも納得がいかないところもある……のだけれど、とりあえず一巡した結果を。
【アンシフトケース】 けにとこさ れっいのるま した★かて くん★゛なー らすよはょ きう、。゜・ 【シフトケース】 ぁゃろほゆ わむやえぇ「 ぃおもあゅ めりつちせ」 ぅねそへふ ぬみひをぉ_
【あ】はシフトケースじゃないだろ……と思って調べてみたら、「あぁ」がたくさん引っかかってるのが原因らしい。
解析結果は良好。
######## zEnd010723.gk1 ######## ## 原文カタカナ.txt ## analyzing 0/ 205 打鍵数 8126 , time 953752 左46.3 [人16.4 中14.8 薬 8.8 小 6.4] 右53.7 [人15.3 中16.5 薬14.6 小 7.2] 上段23.7 中段55.8 下段20.5 (良 7.4) 交互67.1 同指 4.5 跳躍 4.0 (良 1.3) 和音12.0 ok ######## zEnd010723.gk1 ######## ## ev_kenpo.txt ## analyzing 0/ 45 打鍵数 1122 , time 129794 左46.6 [人16.9 中15.2 薬 6.9 小 7.7] 右53.4 [人20.4 中16.1 薬11.6 小 5.3] 上段28.0 中段49.4 下段22.6 (良 8.5) 交互71.9 同指 4.5 跳躍 3.2 (良 0.5) 和音10.7 ok ######## zEnd010723.gk1 ######## ## ev_mekura.txt ## analyzing 0/ 37 打鍵数 3705 , time 428720 左47.2 [人15.8 中16.7 薬 8.8 小 5.9] 右52.8 [人13.0 中17.0 薬14.5 小 8.2] 上段24.5 中段54.3 下段21.2 (良 7.2) 交互68.2 同指 3.7 跳躍 3.4 (良 0.9) 和音13.2 ok
……で。
「イメージしていたソレ」との違いに驚いたので、「カギカッコでくくられている部分」だけを抜き出して、もう一度配列を生成してみた。
【アンシフトケース】 つおほしへろるよねくっ なょ★けめんひ★゛ゃー いもこうちすわ、。゜・ 【シフトケース】 ぁれあのゅかせらをぇ「 ぃそみむえてとさゆは」 ぅきたぬふまやにりぉ_
やばい配列に仕上がってる理由は単純で……。
2-gram | 出現頻度 |
---|---|
」「 | 6.73% |
っ、 | 4.33% |
、あ | 3.85% |
「あ | 2.88% |
あっ | 2.88% |
、」 | 2.16% |
ぁ、 | 2.16% |
あぁ | 2.16% |
、い | 1.92% |
ああ | 1.92% |
っぱ | 1.68% |
いい | 1.44% |
いっ | 1.44% |
して | 1.44% |
っ」 | 1.44% |
ぱい | 1.44% |
、お | 1.20% |
、こ | 1.20% |
、は | 1.20% |
、ん | 1.20% |
ぁぁ | 1.20% |
い、 | 1.20% |
いし | 1.20% |
く、 | 1.20% |
なの | 1.20% |
んな | 1.20% |
あ、 | 0.96% |
あふ | 0.96% |
せい | 0.96% |
っと | 0.96% |
て」 | 0.96% |
ふっ | 0.96% |
もっ | 0.96% |
る、 | 0.96% |
んっ | 0.96% |
ーー | 0.96% |
、せ | 0.72% |
、も | 0.72% |
「ね | 0.72% |
「ん | 0.72% |
あげ | 0.72% |
いく | 0.72% |
いな | 0.72% |
から | 0.72% |
きも | 0.72% |
こと | 0.72% |
これ | 0.72% |
って | 0.72% |
てあ | 0.72% |
なに | 0.72% |
ねえ | 0.72% |
はぁ | 0.72% |
もち | 0.72% |
ょう | 0.72% |
ん、 | 0.72% |
?」 | 0.72% |
……で、ふと思った。
……もしかすると、特定ジャンル小説向けの配列って、「計算で見つけ出す」んじゃなくて、「原理原則を見つけ出して、それに沿うように文字をマッピングしていく」ものなのかも?と。
……いや、上の2-gramを見ていて思ったのだけれど、極端な話、
- 「かえであすか」で、「あ」と「え」を交換する。
だけで、十分対応可能なんじゃないだろうか、とか……そういうことを考えてしまったり。
#「かえであすか」自体には、原理もへったくれもないけど……元の「飛鳥らしさ」がそういう部分を持ってるからねぇ。
文章がちょっと変わるだけで「配列ががらりと変わる」ってのは、ちょっと「原文のミューテートに対する耐性が足りてない」気がして、「推敲を重ねて作る、という、小説の製作プロセスにはしっくり来ない」んじゃないかな、と。
それと、もっと重要なことが……仕上がり文章に対するチューニングをしても、それが「入力したすべて、ではない」ってところが、妙に気になっていたり。
その裏には「使うかどうかわからないけど、全体をプロットするために必要になるつなぎ文章」とか、「実際の文章には絶対使わないけど、小説を書く上で重要なプロットやシナリオの記述文章」とか、そういうのも必要になってくるわけで。
……となると、「日記のように、あまり推敲もせず打ちっぱなしにしたから、そのままソースとして使って計算すれば、大体いい感じに仕上がってくれる」ってゆー、一般的な文章からの配列計算方法って、ある意味ではまったく通用しないのかも。
正直、「エロ小説をソースにすれば、エロ小説のためのけん盤配列が出来るんじゃないだろうか?」なんて考えていた、自分の浅はかさに凹みましたorz。
うーん……これは、「エロ小説向けのかえであすか」を作れということなのだろうか?いや違うかも。