EUC対応について#3

一見かなりまともそうだったのだが、いくつかの文字がどうしようもなかったりした。
補助漢字部分の拡張が目的ではあるが、それにより今まで変換できた文字が出来なくなる。
WideCharToMultiByteで、UTF-16からSJISへの変換に成功した文字の内、
UTF-16からEUCへの変換に失敗したのは、「昴」「~」とか14文字だ。
逆にそれらを、MultiByteToWideCharで、EUCからUTF-16に変換すると、
似て非なるコードに割り振られたり、似てない非なるコードに割り振られたりする。
ちょっと待てよと。
今回はEUCへの変換に失敗した文字だけに注目したが、
この分だと変換に成功したけどまるっきり間違っているってのも多いんじゃないかと。



CP20932を利用する変換は破綻した。

CP51932はWideCharToMultiByteもMultiByteToWideCharも動作しないので、
あとは旧来のSJIS経由変換か、変換表作成しか残っていない。

CP20932の変換もせっかく作ったので残そうかとも思ったが、
普通のEUC変換とどこが違うのかを説明したりするのも面倒だしスッキリしないのでナシで。

たぶん関連のある記事:

コメントは終了しています。