はてな日記で入力時に注意を要する漢字

 斷片的に過去の日記で觸れてゐるが、ここでまとめてみよう。ここでいふ「はてな日記」とは、d.hatena.ne.jpで始まるものに限定する。g.hatena.ne.jp系は最近使ってゐないし、文字コードが違ふので事情が異なると思ふ。

 さて、表示できる文字であるが、これは、HTMLの仕樣上、ユニコード文字全部だ。これは入力環境とは關係ない。極端に言へば、數値表現で漢字の符號値を指定すれば、英數字だけでも日本語のページは作成可能である。

 ただ、實際の表示となると、ブラウザー側でフォントの處理を正しく行ふ必要がある。PC系の場合、JIS第1・2水準以外を使ふと醜い表示になる場合も多い。携帶電話系の場合は、主流は、JIS第1・2水準しか對應してゐない。

 さて、入力であるが、JIS第1・2水準以外の文字は、はてな日記はHTMLの數値表現に自動變換してゐるやうだ。だから、入力時はそのままベタで文字を打ち込んでいけばよい。

  • JIS第1・2水準→そのまま
  • それ以外→HTMLの數値表現

 内部の表現形式は違ふものの表示上は漢字の仲間として表示される。

 ところが、困ったことにウィンドウズ外字は、兩者の挾間で文字化けを起こす。これは、はてな日記のバグである可能性が高いので、將來、修正されるかも知れないが、現時點での回避策は、ウィンドウズ外字を數値表現で入力することである。

 しかし、どう目を細めて漢字を眺めても、「私は外字です」といふポップアップが出るわけでないので、コンピュータの助けが必要になる。そのときは、『漢字變換道具』で「無變換」を選び、「JIS標準文字以外を數値表現」をチェックすると良い。さうすれば、JIS第1・2水準以外の漢字を數値表現に置き換へてくれる。