2009-09-24から1日間の記事一覧

(memo)たとえば、「巷に溢れるエロ小説」をOCRにかけて、それのn-gram列を「最も打ちやすい」配列は何か?を計算する、とか。

……いや、あえて「エロ小説」に限定する必要はぜんぜんなくて、「ある特定の分野にとって(略」とかでもいいと思うけど。 ……ってゆーか、逆だな。 【それのn-gram列を「最も打ちやすい」配列をつくる】べきか。 ……正直、出現頻度が結構偏っていそうな「エロ小…

(memo)○○配列だけが有利に評価されるような、「インチキ例文」って、どうやって作ればいいのだろうか。

……って、これはやっぱり「評価スクリプトみたいなの」をつくって、たくさんの文章からフィルタリングするものなのかも?*1 あるいは、配列構造から考えて「わざとそういう【ことえり】をする」のかなぁ。 こういうインチキ例文をたくさん集めて「なぜそれを…