漢字探し

「JIS漢字コードが符号化しているのは、社会に通用してきた「文字」である。その中で「ケ」のような形をしたものには、「け」と読む片仮名と、「こ」「か」「が」と読む漢字がある。異論もあるが、青空文庫の作業では、その立場をとる。実作業では、底本の文脈を読み、入力対象がどちらかを見きわめて、対応するコードを入れよう。」

もう一方からは、「JIS漢字コードは、「文字の種類」と「形」の組み合わせのみを規定している。「ケ」の形をしたものは、JISには、大小二つのパターンが、片仮名のみにある。底本の「ケ」のような形をした文字は、この大小の差異をキーとして、どちらで入れるか決めるべきなのだ。」とする、「見かけ」を重視する立場が主張されました。

 このやうに列挙すると青空文庫が何か特別な挑戦をしてゐるやうな気がするけど、次の表をみると当たり前のことだと思ふ。むしろ後者の方が分が悪い。さて、次の表には漢字が何個隠れてゐるか?ヒント、一桁ではない。

丿