JIS2004 と JIS90 は何が違うのか?

自分も正しく理解していない節があるので、間違いがあるかもしれません。

  • JIS90 と JIS2004 では何が違うか
    1. JIS2004 にはフォントが 303 文字追加された
      • VistaIME パッド使って実際に確認すると 304 文字あるが、1 文字は重複
    2. JIS2004 は JIS90 の 751 文字を旧字体から新字体に直した (もしくはその逆)
      • が具体的
    3. それ以外は JIS90 と等しい
  • Windows Explorer におけるファイル名の実装
    • 基本 Unicode で記録される
    • Windows Vista で 1 の漢字を使うと、一部表示できるが一部表示できない
    • LinuxS-JIS (最近は違うらしい) なので、Samba や FTP その他アプリによるファイルのコピーはできない
      • エラー処理は Samba サーバーや FTP クライアントに依存、この辺は (XP の時代にも同じ問題を抱えているので) エラー処理してくれるはずなのだけど、その他のアプリは基本 NG だと思うべし
        • 名指しをするなら NetVault は NG だった
          • Windows 上のファイルをものの見事に全部 S-JIS で扱うらしい
        • 玄箱とか全然ダメって聞くけど大丈夫なの?
  • Windows Vista のメモ帳における JIS2004 の実装
    • JIS90 で表示できる文字 (上述 2 と 3) で作成した場合 S-JIS が Default (Unicode に変換は可能)
    • JIS2004 で追加された文字 (上述 1) で作成した場合強制 Unicode
      • 1 の文字を使ったファイルを無理やり S-JIS で保存すると、Vista でも該当文字が失われる
  • JIS X xxxx と文字コードの違い
    • 「JIS ほげほげ」は「使用する文字とその字体」を定めた規格
    • S-JISUnicode (正しくは UTF-8/16) は「文字とバイナリの関連付け」を定めた規格
    • すなわち、JIS90 で規定された文字は S-JISUnicode の両方にマップされている
      • フォント ファイルがこの役割を持っている
      • つまり JIS ほげほげで規定されたフォント一式と、フォントと文字コードをマップしたデータ
  • JIS2004 の 303 文字 (上述 1) はなぜ S-JIS で扱えないか
    • 303 文字は 2004 年に追加された
    • いまさら追加されても S-JIS にはそんなに空きバイナリがないので逆立ちしても実装できない
      • S-JISJIS2004 の追加文字を捨てざるを得なかった