EUC対応について#4

1220 letters | 532 views | コメントする

二つの方法がダメになった。
○SJISを経由すると補助漢字が失われる。
○CP20932でもうまくいかない。
で、最後の方法として、
○アプリが変換テーブルをもつ。
コレをやるにあたり、
http://www.unicode.org/Public/MAPPINGS/OBSOLETE/EASTASIA/JIS/
にあるテキストファイルを使用した。
矩形選択と正規表現置換で、完璧にDelphiコードに変換できた。
そして実際に正しい変換が出来るかやってみた。



これも全然ダメ。
ユニコード全文字を上からざっと見ていくと、最初に目につくのが「№」という文字。
JIS0208.TXTで、0x2D62を0x2116に変換する記述がない。
0x2840の次が急に0x3021まで飛んでいて、0x2D21から0x2d70にある文字ゴッソリない。
おかしいのはここだけじゃなく、本当に大量におかしいのだ。
CP20932の変換がマトモに見えるくらい相当おかしい。
コレってJIS X 0208 (1990) to Unicodeって書いてあるから、
78の旧JIS、83の新JIS、90の情報交換用漢字符号、97の規格厳密化、という流れの、
90年版に相当するもののようだが、EUCで使われるJIS0208とは異なると言うことなのか。
補助漢字対応の前に、第一水準&第二水準漢字で既に変換できなくなってる。

さて、これからどうしようかな。
○もっと良い変換表を探してくる。
○OSの挙動を調べて自分で作る。
○あきらめる。
CP20932で実装した時点で、気分はもう補助漢字対応当たり前になっているので、
もう後戻りはしたくない。

B0002V04GM
B0002V04GM

たぶん関連のある記事:

コメントは終了しています。