JIS対応について

1505 letters | 562 views | コメントする

EUCへの対応については、補助漢字領域の拡張を目的に進めてきた。
すなわち、旧来のSJIS変換を行うとEUCにしかない文字が失われてしまうので、
SJISを介さずにEUC<->ユニコード変換を行うように仕様変更だ。
それはもうできあがったからそれで良い。
次にJISへの対応をどうするかという話だ。

JISは多くの拡張がなされているため、全てに対応すれば中韓国語も扱えるはずだ。
だが、中韓国語拡張したJIS文字コードはどこで利用されるのか甚だ疑問。
そもそも、なぜテキストエディタがJIS文字コードに対応しなきゃいけないかというと、
メールソフトが拡張子.emlで保存するファイルを編集するためだ。
このファイルを真魚で編集し、中韓国語を織り交ぜたJISファイルを作ったとして、
メールソフトが翻訳できなければ意味ないわけだ。
EUCやユニコードの場合なら、SJISに変換出来ない文字を書いたとしても、
それは変換しないソフトの方が悪いんであって、文字を書く方に罪はない。
しかしJISの場合は別だ。
メーラーあってのJISファイルであり、メーラーの対応を無視したJISは意味がない。
よって真魚は、どんなメーラーでも読み込めるであろう普通のJISしか書き出さないことにする。
いろんなJISの選択肢を見せたところで、素人には選べないからな。

どうなれば普通のJISなのか?
ためしに、利用人口が最も多いであろうOutlook Expressで新規保存し、
バイナリエディタで覗いてみたところ、
半角カタカナは全角に変換、ESC$B&ESC(Bでスイッチ、と言う形になっていた。
真魚もこの方法で保存すれば間違いない。
しかし問題は私用領域であり、規格には沿わないけれどちゃんと保存されている。
真魚も規格からはみ出ることを承知で保存して良いものかどうかは疑問。
ちなみに現在使っているjconvert.pasでは、
半カナは全角に、ESC$B&ESC(Jでスイッチ、私用領域も使用、という仕様だ。

逆に読み込みはなるべくたくさんの形式に対応しないといけない。
中韓国語とまでは行かないが、半角カタカナ部分だけでもいろんな書き方に対応したい。
で、いろんな書き方で半カナをまぜて作られたJISのメールは、
真魚で編集すると勝手に全角に書き換えられちゃうよ、と言う仕様でいこう。
いや、つまり今まで通りかわらないってことだが。

EUCのために作ったテーブルをそのまま使って変換すればバッチリだろう。

B000ADD52M
B000ADD52M

たぶん関連のある記事:

コメントは終了しています。