EUC対応について#5

JISX0212の補助漢字領域の資料が正しいかどうかはわからないが、
JISX0208の第一水準、第二水準漢字領域については、
資料には不備が多すぎて使い物にならなかったと言うことで、
CP50220を使って、OSにJISX0208領域を実際に変換させてテーブルを作成させた。
そしたら、CP20932を使ったときと同様、それと同じ文字で問題があった。
これも、SJIS経由での変換とは多少違った物を作ってしまった。
いや、多少かどうかは知らないよ。全部は確認してないから。
ただ、コレで作ったテーブルを用いてEUCからユニコードにコンバートしてみたら、
目立って違っていたのがそれらの文字で、似たような変換なんだろうと思っただけ。



あと、ユニコードで0xE000あたりに存在する私用領域ってのがあるんだけど、
そのあたりはJISで0x7F21からってことになっていて、
0x21から0x7Eしか定義されていないのに7Fを使われたら変換できない。
CP50220でMultiByteToWideCharしようとすると、7Fはやっぱり受け付けてくれない。
OSによる変換はSJIS以外全然ダメってことでいいかな。
ちなみにこの私用領域の文字、EmEditorでEUCに保存しようとすると、
なぜかそこだけSJISで保存する。
よって、EmEditorで保存したEUCファイルはサポート外ということで。

さて、CP50220による変換表も使えないわけだが、一番良い方法を忘れていたよ。
今まで使っていたjconvert.pasを使って、SJIS経由で変換する表を作ればいいんだ。
そうすれば、今までのEUC文字は今まで通り、
補助漢字領域は不備があるかも知れないけど一応1990年のもので対応できる。

はぁ、EUCで命落とすかも。

たぶん関連のある記事:

コメントは終了しています。