……出来上がっていた。

(過去:とりあえずてすとちゅー。 - 雑記/えもじならべあそび)
(過去:(memo)たとえば、「巷に溢れるエロ小説」をOCRにかけて、それのn-gram列を「最も打ちやすい」配列は何か?を計算する、とか。 - 雑記/えもじならべあそび)


 どうも納得がいかないところもある……のだけれど、とりあえず一巡した結果を。

【アンシフトケース】
けにとこさ  れっいのるま
した★かて  くん★゛なー
 らすよはょ  きう、。゜・


【シフトケース】
ぁゃろほゆ  わむやえぇ「
ぃおもあゅ  めりつちせ」
 ぅねそへふ  ぬみひをぉ_

 【あ】はシフトケースじゃないだろ……と思って調べてみたら、「あぁ」がたくさん引っかかってるのが原因らしい。
 解析結果は良好。

######## zEnd010723.gk1 ########
## 原文カタカナ.txt ##
analyzing        0/     205
打鍵数 8126 , time 953752
左46.3 [人16.4 中14.8 薬 8.8 小 6.4]
右53.7 [人15.3 中16.5 薬14.6 小 7.2]
上段23.7 中段55.8 下段20.5 (良 7.4)
交互67.1 同指 4.5 跳躍 4.0 (良 1.3) 和音12.0
ok
######## zEnd010723.gk1 ########
## ev_kenpo.txt ##
analyzing        0/      45
打鍵数 1122 , time 129794
左46.6 [人16.9 中15.2 薬 6.9 小 7.7]
右53.4 [人20.4 中16.1 薬11.6 小 5.3]
上段28.0 中段49.4 下段22.6 (良 8.5)
交互71.9 同指 4.5 跳躍 3.2 (良 0.5) 和音10.7
ok
######## zEnd010723.gk1 ########
## ev_mekura.txt ##
analyzing        0/      37
打鍵数 3705 , time 428720
左47.2 [人15.8 中16.7 薬 8.8 小 5.9]
右52.8 [人13.0 中17.0 薬14.5 小 8.2]
上段24.5 中段54.3 下段21.2 (良 7.2)
交互68.2 同指 3.7 跳躍 3.4 (良 0.9) 和音13.2
ok

……で。

 「イメージしていたソレ」との違いに驚いたので、「カギカッコでくくられている部分」だけを抜き出して、もう一度配列を生成してみた。

【アンシフトケース】
つおほしへろるよねくっ
なょ★けめんひ★゛ゃー
いもこうちすわ、。゜・


【シフトケース】
ぁれあのゅかせらをぇ「
ぃそみむえてとさゆは」
ぅきたぬふまやにりぉ_

 やばい配列に仕上がってる理由は単純で……。

2-gram 出現頻度
」「 6.73%
っ、 4.33%
、あ 3.85%
「あ 2.88%
あっ 2.88%
、」 2.16%
ぁ、 2.16%
あぁ 2.16%
、い 1.92%
ああ 1.92%
っぱ 1.68%
いい 1.44%
いっ 1.44%
して 1.44%
っ」 1.44%
ぱい 1.44%
、お 1.20%
、こ 1.20%
、は 1.20%
、ん 1.20%
ぁぁ 1.20%
い、 1.20%
いし 1.20%
く、 1.20%
なの 1.20%
んな 1.20%
あ、 0.96%
あふ 0.96%
せい 0.96%
っと 0.96%
て」 0.96%
ふっ 0.96%
もっ 0.96%
る、 0.96%
んっ 0.96%
ーー 0.96%
、せ 0.72%
、も 0.72%
「ね 0.72%
「ん 0.72%
あげ 0.72%
いく 0.72%
いな 0.72%
から 0.72%
きも 0.72%
こと 0.72%
これ 0.72%
って 0.72%
てあ 0.72%
なに 0.72%
ねえ 0.72%
はぁ 0.72%
もち 0.72%
ょう 0.72%
ん、 0.72%
?」 0.72%

……で、ふと思った。

 ……もしかすると、特定ジャンル小説向けの配列って、「計算で見つけ出す」んじゃなくて、「原理原則を見つけ出して、それに沿うように文字をマッピングしていく」ものなのかも?と。


 ……いや、上の2-gramを見ていて思ったのだけれど、極端な話、

  • 「かえであすか」で、「あ」と「え」を交換する。

だけで、十分対応可能なんじゃないだろうか、とか……そういうことを考えてしまったり。
 #「かえであすか」自体には、原理もへったくれもないけど……元の「飛鳥らしさ」がそういう部分を持ってるからねぇ。


 文章がちょっと変わるだけで「配列ががらりと変わる」ってのは、ちょっと「原文のミューテートに対する耐性が足りてない」気がして、「推敲を重ねて作る、という、小説の製作プロセスにはしっくり来ない」んじゃないかな、と。
 それと、もっと重要なことが……仕上がり文章に対するチューニングをしても、それが「入力したすべて、ではない」ってところが、妙に気になっていたり。
 その裏には「使うかどうかわからないけど、全体をプロットするために必要になるつなぎ文章」とか、「実際の文章には絶対使わないけど、小説を書く上で重要なプロットやシナリオの記述文章」とか、そういうのも必要になってくるわけで。


 ……となると、「日記のように、あまり推敲もせず打ちっぱなしにしたから、そのままソースとして使って計算すれば、大体いい感じに仕上がってくれる」ってゆー、一般的な文章からの配列計算方法って、ある意味ではまったく通用しないのかも。
 正直、「エロ小説をソースにすれば、エロ小説のためのけん盤配列が出来るんじゃないだろうか?」なんて考えていた、自分の浅はかさに凹みましたorz。


 うーん……これは、「エロ小説向けのかえであすか」を作れということなのだろうか?いや違うかも。