甲丁乙、やってまうた、日記ボロボロ

 讀者の皆さんにとって、今日の日記が一番重要な情報かも知れない。はてな日記に、インポート/エクスポート機能があるのはご存知だと思ふ。エクスポート機能はデータをマメに管理する人は何度か試してゐると思ふ。實行すると、XMLやテキスト形式で過去の日記が取得できる。

 さて、過去の日記につけてあるカテゴリを整理しようと思ひ、エクスポートしたファイルを編輯した。輕い氣持で、インポートした。多分、私の推測では、同じ段落番號がついてゐるものは上書されるか、無視されるかのどちらかであると思ひ、失敗しても問題ないだらうといふ認識だった。手許にバックアップも持ってゐるし、再挑戰すればいいと思った。

 試したことのある人ならお分かりと思ふが、インポート後、處理が數分から數十分かかる。しばらく待ったところ、何も變化が起きないので、多分インポートに失敗したんだらうと思ひ、後日、もっとスマートな方法を考へ、それで挑戰することにして、取り敢へず、ゴミファイルは消して、寢る準備をした。

 寢る前に、自分の日記を覗いたところ、特に變化はないが、何か違和感がある。さう、過去の日記が多重化されてゐるのである。誤送信も含めて日記が三重化してゐる。確かに、この擧動を想定するべきであった。もちろん、日記が消えるよりはマシだが、150日もある全日記の書き換へが必要になる。頼りになるバックアップファイルも、かういふ時に限って、ゴミといっしょに消してゐた。從って、次にエクスポートでバックアップを取得しても、三重化した壞れた日記しか得られない。今のところ2007年分だけは、手作業で何とか復舊したが、それ以前の100日分の日記は後日また復舊するしかない。

 殘念なことに、2007年10月23日のJIS第3,4水準の部分(d:id:ziom:20071023#p4)は、ウィンドウズ外字の部分が化けて、他の部分も破壞されてしまった。偶然、斷片的に該當日の日記が手許にあったので、文章だけは復舊できたが、JIS第3,4水準のリストは壞れたままだ。リストは後日再作成するが、ウィンドウズ外字は、はてな日記の鬼門でもある。

 さて、殘りの作業だが、はてな日記のエクスポートファイルはXML形式なので、一時間もあれば、多重化した日記を一元化するプログラムは書けるのだが、それでも100日程度の日記を手作業で消してから、該當日の日記を讀み込まなければならない。該當日を削除した場合、トラックバックやコメントも削除されてしまふが、これは仕方ない。(私はトラックバックやコメント公開してゐないが私的屬性で持ってゐる。)更に都合の惡いことに、ルビ付き日記の頃は、まだ正字を再現する意欲が強くて、ウィンドウズ外字を多用してゐる。ウィンドウズ外字といふ地雷は視認で檢出することができない。壞れる危險と常に隣合はせだ。

 確かに、最終兵器「全削除」で削除後、綺麗な日記をインポートする方法もあるが、これはさすがに失敗すると怖い。それなら、結局手作業で修正した方が確實かもしれない。

 ところで、この手の題材を書き連ねた日記は、資料系の日記と違ひ、檢證作業が省けるので、意外と文字數を稼げる。それだけが不幸中の幸ひか?