打鍵評価システムにおける評価関数に関しての雑感。

カナの特徴によって、何をどう優先するかは様々で、やはり長期間色々並べ
替えてみて、評価打鍵を大量にしてから、感想を指に訊くのが一番です。

連接表のデータは一つの参考データに過ぎません。

他に「漢語パートで速く打ちたい」とか発声と打鍵の一致の要請、長い言い回しで
「く・な」のようによく使われるので何とかホームに入れて打鍵のスムーズさを得たい、
それにシフトの連続やら入れ替えられる側のカナの事情、それに各指の負担能力の問題
など、決定のための要素は様々あります。

「せ」のように出現率が高い割りに、左であれば置かれる位置に余り文句を言わないカナもあります。

最後は、その連接に適用できる幾つかの法則が、それぞれその連接を含む単語に
応じて何票かを持っていて、投票で決めるんです。とか言っても、
本当には、そんな選挙の開票作業なんか出来るはずもありません。

長期間の配列作りと評価打鍵の過程で養われる感覚があると判断が速くなるものです。
(from http://ameblo.jp/asuka-layout/entry-10010988743.html at 2006-04-05 17:15:45)

 これも関数化しづらい。
 一番ややこしいのは、文字連接データが「実際には連接を考慮する必要がないもの」まで全部ひっくるめて集計してしまう可能性があるところ。
 「読点or句点→カナ」は無視しても良いと解っても、「カナ→カナ」には大量にそれが含まれてしまっている場合があり得る。
 評価打鍵で使いやすい程度に「形態素分解でバラしたカナをつなぎ直す」とか、そういう操作を必要とするのかもしれない。

例として……

Rayさんとこの2006年4月記事から「括弧書きの語」(≒打ちにくくならないように出来たもの)を拾ってみた。

イ以外のイ行は左の表か裏、ゃゅょはN.,の表
あぶなくない
あれ
いさ
うれしい
えい
えだ
えば、
える
えん
おな
かい
かえ
がえ
かぶらないと
かん
ください
ぐち
ぐみ
くれ
くれなく
けい
けで
けん
ごう
こく
ごく
ごぞ
これ
これは
さい
ざい
さく
され
ざん
じぶ
しみ
ぞう
そうぞう
ぞく
それ
それぞれ
それに
それは
たい
だけ
だけで、
だけです。
だけど、
ださ
だれ
だれに
たん
ちえ
つづく
って
つれ
で、
です。
ですね。
てんてい
どく
ない
なか
なく
なくなる
なら
ならない
なん
なんで
なんない
にほん
ね。
パー
はぶかなくては
ひえ
ひみ
ファ
フィ
フェ
フォ
ふい
ふえ
ぶき
ふく
ぶち
ぶひ
ぶり
ふる
ふん
ぶん
ほん
まえ
ますね。
まれに
みち
みて
みね
みら
みり
メモ
もく
ょう
られない
れい
れる
れん
わけ
わけで、
わけです。
わたし
われわれ
自分
知れない
彼に
部分
分解
文化
文章
(from http://ameblo.jp/asuka-layout/archive-200604.html )