假名と韻母の出現頻度をまとめてみた

 昨年からの流れで、ローマ字入力への關心がまだ續いてゐるので、年初から奮發して、假名と韻母の出現頻度をまとめてみた。(そのせゐで、最近は單發の更新しかできなかった。)假名に關しては、「拍」「文字」「文字部品」の單位に分けた。韻母とは、漢字音において頭の子音を除いた部分を指す。例へば、「KAN」なら「K」を取り除いた「AN」が韻母になる。

 問題はコーパスであるが、データの中立性、著作權フリー、追試可能性として、常用漢字音訓表にした。自分に有利な結論になるやうに操作できないといふ意味で公平なデータだと思ふ。問題點は、助詞・助動詞が反映されないことだが、「を」を除けば、現状でも有意な結果が得られるであらう。逆に「を」まで反映したデータを取得するには、どうしても自然文が必要になり、これには、常に中立性や著作權の點で問題が付きまとふ。したがって、「を」の一文字について對象から外すが、大勢に影響はないはずだ。

 さて、打鍵數を減らす方法として、今後、以下の點について考察していきたいと思ふ。

  • 韻母に注力する方法
  • 拗音に注力する方法
  • 直音に注力する方法