「新JISはNICOLAから生まれた!?」&「新JISにも版番号があった……しかも、次点配列はある意味さらに魅力的」

(過去:メモ。@2006年05月13日 土曜日)


 安岡さんから教えていただいた「仮名漢字変換用けん盤配列の標準化に関する調査研究」な件、今日そのコピーが国会図書館から到着しました。


 で……まずはおなじみ、NICOLAのけん盤を示します。

【無シフト面】
。かたこさ らちくつ,、
うしてけせ はときいん
.ひすふへ めそねほ

【同手シフト面】
ぁえりゃれ よにるまぇ
をあなゅも みおのょっ
ぅーろやぃ ぬゆむわぉ

※濁音は逆手シフト+文字キー。
(from http://nicola.sunicom.co.jp/spec/jisdraft.htm)

 次に、昭和58年度の実験で使われていた「NICOLAを濁点分離化した三段かな配列」を、下に掲示します。

【無シフト面】
えかたこさ らちくつせま
うしてけ゛ ゛ときいは゜
 ひすふへ めそねほわ

【センタシフト面】
。ぁりゃれ よにるぇー,
をあなゅも みおのょっん
 ぅろやぃ ぬゆむぉ・

※59年の実験では、シフトをB段小指外方シフトに移した本配列も、供試装置として用いた(59年度版p7の「3.2.入力実験について」に記載あり)。
(from 「日本語情報処理の標準化に関する調査研究報告書」58年度版 p23)


 58年度版で興味深い点は2つ。

  • キーボードは、市販のテンキーを組み合わせて作成した(NICOLAでは電卓を使っていましたね)。つまり、3段配列の打鍵測定は「段ずれの無いスクエアキーボードを使って行われた」ということ。
  • 試験用の3段配列は「ナンセンスシラブルの入力専用に使用するので」連接や頻度を考慮せずに設計した。

 前者が「スクエアキーボード」という共通の祖先(?)を持っていたことは意外でしたが、もっと意外だったのは「NICOLA似の配列を使っているにもかかわらず、日本語として通じないナンセンスシラブルのみを通した」あたりですね。
 もっとも、ナンセンスシラブルにも「日本語の音節パーツが部分的に入る」ことはあるから、結局キー単位(文字単位?)ではNICOLAの影響を受けるし、濁点がGHキーに配置されているのでこれらキーが不当に高く評価される可能性もありそうです。
 それにしても、ナンセンスシラブルを打つならどうして「五十音順キーボード」とかにしなかったのでしょうか。
 そうであってはいけない理由があるから、あえて真っ当な評価が期待できるNICOLAを下敷きにした……と考える方が自然なのかもしれません。


 ついでに、読み始めたばかりの59年度版では、もっと興味深い点が。

  • 小指シフトの操作が、文字キーの操作よりも若干遅れる被験者が居た。文字キー側を押下後若干(数十ms)遅延して出力させることで、この誤りは激減した。

 えーと、モロに同時打鍵ロジックタイムシフト方式そのものですな……^^;
 こういう場合、親指シフト用の「同時打鍵+プレフィクスシフトの許容(片手操作対応アクセシビリティ)」を小指シフトキーに対しても用いることで、ほぼ同等の改善効果を得ることができます……ちょっと仰々しいですが、やっていることは同じ様な感じですし。
 #注:成果物である新JISかなには、確かタイムシフトは規定されていなかったはず。というか、英字キーにも使えるのかも。


 それと、59年度版には、次のデータが含まれています。

  • p13、濁点分離かな文字出現頻度(数字はまとめてN、英字はまとめてA、その他の記号をTにひとまとめ、他はJIS C 6233と同じかな63字で、合計66字)
    • 二字連糸の1文字目に出現する回数と同2字目に出現する回数(N・A・T以外は常に一致)・百分率・率の累計が付されている。
    • 順序は【゛いうんしかのとてたき、くはにこるょつせなっをりNすけ。さあちそれゅらふよもおTほえまめひみわAや・へ゜ろねーゃむゆ」「ぃぬぇぁぉぅ】。
      • 口語体と比べて【な】【は】【す】【ま】【も】がかなり低い順位に位置している気がする。
  • p14〜p46、濁点分離かな2字連糸。第1位の「か゛」(22261回)から、第2962位の「゜よ」(1回)まで【全て】載っています。頻度の合計は1,291,682回。
    • 普通に考えて、「新JISかなの追試・濁音分離かな配列の再設計・清濁分離速記系かな配列の省打鍵部分設計」が可能な規模。凄すぎ。
  • p48、新JIS規格の「4.3.2(1)アンシフト側/シフト側文字セットの決定」からは漏れているが、「濁音・句点・読点は右」「【か】は左」は原則とされた……理由は【2字連糸で第1位の「か゛」(22261回)】によるものだと思うものの、それを明記してはいない。また、同じく漏れているが、シフト側文字セットでは、C段に高頻度かなを……のみではなく、中指と薬指に高頻度かなを割り当てて、小書きの【ぁぃぅぇぉ】は(おそらくNICOLAの設計指針と同じ理由で)シフト側辺縁部に一括配置した。
  • p49〜p50、新JISかなにも配列番号があった。左手文字セットで最終的に残ったのは「1-58-222:指負荷分散型」「1-221-197:指負荷集中型」、右手文字セットでは「1-53-160:指負荷分散型」「1-40-6:指負荷集中型」。
    • 最終的に残ったのは左手が「1-221-197:指負荷集中型」で右手が「1-40-6:指負荷集中型」。


 ちなみに、左手が「1-58-222:指負荷分散型」で右手が「1-53-160:指負荷分散型」の配列(アンシフト側のみ)も掲示しておきます……人差し指の【総使用頻度】は両手共に2割強も低く、逆に人差し指の【連続使用頻度】は両手共に高め。

次点新JIS配列案の左右合成配列・アンシフト側

さけてょせ をつうのりち
はしかとた くんい゛きな
すこにあそ っる、。れ
(from 「日本語情報処理の標準化に関する調査研究報告書」59年度版 p50)

 面白いことに、文書内で「指負荷」が「分散されている」か「集中しているか」の判断指標とされているのは、【総使用頻度】ではなくて、なぜか【連続使用頻度】なんですよね……いつもは「総使用頻度」でしか考えないものですから、この文書で言うところの「分散・集中」の意味を捉え間違えそうになりました^^;
 もともと、左手用の「1-58-222:指負荷分散型」と右手用の「1-53-160:指負荷分散型」が最終選考で落ちた理由は【入力速度がやや劣る】ことのみだったりするわけです。


 うーむ……総使用頻度を優先すれば、人差し指を酷使しない左手用の「1-58-222:指負荷分散型」と右手用の「1-53-160:指負荷分散型」の組み合わせというのは、実はかなりナイスな組み合わせなのではないかと睨んでいます。
 なんといっても「シフト側は中指と薬指に頼った配列」なのですから、「アンシフト側も同じにすれば、多少上下動が絡んでも全然問題ないのではなかろうか?」という気すらしてしまいます。


 私の個人的予想で恐縮ですが、もしも

  • 左手が「1-221-197:指負荷集中型」で、右手が「1-40-6:指負荷集中型」のアンシフト側配列
  • 左手が「1-58-222:指負荷分散型」で、右手が「1-53-160:指負荷分散型」のアンシフト側配列

と、現行のシフト側配列を組み合わせて【1年間掛けて評価打鍵を実施】した場合、おそらくアンシフト側には

  • 左手が「1-58-222:指負荷分散型」で、右手が「1-53-160:指負荷分散型」のアンシフト側配列

が選ばれていたのではないかな……と想像していたりします。
 飛鳥ほど【ホームポジション死守】を守っているわけではないものの、2割強も人差し指の使用頻度が低いとなれば、ほぼ確実に【指の左右動がおとなしく、多少遅くはなるものの軽やかに打鍵できる配列になる】可能性があったのではないかな……と。
 しかも、59年度版のp51を見る限りでは「良い方(指負荷集中型)で176字/分、悪い方(指負荷分散型)で174字/分」……わずか1.149%の僅差(というか、ハッキリいって誤差範囲に近い)という状況ですし……かなり微妙。


 では、最後に本物の新JIS配列と、次点新JIS配列を並べてみたいと思います。59年度版にはアンシフト側は案が一つしか掲載されていないので、これは同じものを両方に適用します。

本物の新JIS配列
【アンシフト側】……左手が「1-221-197:指負荷集中型」で、右手が「1-40-6:指負荷集中型」
そけせてょ つんのをりち
はかしとた くうい゛きな
すこにさあ っる、。れ

【シフト側】
ぁ゜ほふめ ひえみやぬ「
ぃへらゅよ まおもわゆ」
ぅぇぉねゃ むろ・ー
(from 「日本語情報処理の標準化に関する調査研究報告書」59年度版 p50)
次点の新JIS配列
【アンシフト側】……左手が「1-58-222:指負荷分散型」で、右手が「1-53-160:指負荷分散型」
さけてょせ をつうのりち
はしかとた くんい゛きな
すこにあそ っる、。れ

【シフト側】
ぁ゜ほふめ ひえみやぬ「
ぃへらゅよ まおもわゆ」
ぅぇぉねゃ むろ・ー
(from 「日本語情報処理の標準化に関する調査研究報告書」59年度版 p50)

 もっとも、仮に「次点の新JIS配列」が選ばれた日には、方々から「はしか配列」「しかと配列」「さけて配列」とか色々と言われて馬鹿にされる可能性は否定できないわけですがorz
 どちらにせよ、この「次点の新JIS配列」を基礎にして月系配列を作ると、あるいは面白い結果を導き出せるのかもしれません。


 しかし、これは良さそうですねぇ……危なく(?)新JISに惚れそうになりましたよ^^;。
 もしも【1年間の評価打鍵を経て、評価打鍵者の意見を元に決定する】という方法をとっていたら、たぶん人差し指の負担が重すぎはしない「次点の新JIS配列」が選ばれていたと思います。
 なぜ?って、それはもちろん「人差し指は過信できるほど強くは無いから」でしょうね。新JISでも十分問題なく設計されているとは思うのですが、もしこの(両者共にナイスな)2者配列を長期間評価打鍵すれば、おそらくは誰もが「より指に負担が掛からないほう」を選ぶでしょうし。


 【歴史にifは禁物】とは言いますが、ここまで計算しつくしたのであれば、最後はやっぱり「評価打鍵」に頼るべきだったのではないかな……と、今ではそう思ってしまうわけです。
 もっとも、この2案を選出した「計算による配列の設計」というやり方は、そうそう馬鹿にはできないこともハッキリしたような気がします。
 うーん、それにしてももったいないなぁ……orz

(2006年6月1日1:37:19追記)ketttさんからのトラバで気づいた。

 補足説明をします。
 左手側配列である

  • 「1-221-197:指負荷集中型」のアンシフト側配列
  • 「1-58-222:指負荷分散型」のアンシフト側配列

と、右手側配列である

  • 「1-40-6:指負荷集中型」のアンシフト側配列
  • 「1-53-160:指負荷分散型」のアンシフト側配列

については、それぞれを組み合わせて作成可能な「4種」配列を全てシミュレータに掛けて、打鍵時間を算出しています。


 このとき、右手側が「1-40-6:指負荷集中型」であれば、左手側は「1-221-197:指負荷集中型」と「1-58-222:指負荷分散型」のどちらを用いても、入力速度はほぼ同一(176字/分)でした。右手側が「1-53-160:指負荷分散型」の場合は、これよりも約2字/分程度遅い事も似ていました。
 右手側に「1-40-6:指負荷集中型」を選んだため、左手側も同じ傾向を持つ「1-221-197:指負荷集中型」を選択し、これが最終案となりました。


 59年度版 p51では「指負荷集中型配列は、指負担が人差し指に集中している」という風な表現があり、これを「考慮して」選んだそうです……って、前に書いていた「総使用頻度/連続使用頻度」の絡みは勘違いだった様ですorz
 新JISかなは「強い指か否か」ではなくて「すばやく打てる指か否か」を元に文字配列を決定した……と。ここも見事にNICOLAの影響を強く受けているのかも……いや、打鍵「速度」を基にしたから、「結果として」似た結論にたどり着いた、と見なすべきか。

訂正。(2006年6月2日12:48:15追記)

 かなり重要な訂正です。59年度版49ページの記述を読み間違っていました。
 シフト側文字で指負担が高く設定されたのは「中指と薬指」ではなくて「人差し指と中指」です……ひどい読み間違いをしていましたorz