アーカイブ
いきなりつまずいた。 .NETでの50220変換と、WideCharToMultiByteでの50220変換で結果が違うじゃん。 で、何が違うのかというと、WideCharToMultiByteだと、補助漢字領域が使えてる。 ESC$(Dとか含むJISファイルなんて、真魚ぐらいでしか読み込めないって。 そんなファイルを書き出しても意味はない。 さて、真魚は7bitルールを守る変換に移行するのは決定だが、 WideCharToMultiB…続きを読む
しばらく間が空いたのでおさらいからだ。 この話は、既存のEUC変換では対応してない補助漢字領域に対応することから始まった。 既存の方法では対応してないので、対応するように関数を書いたわけだ。 そのついでとして、JIS変換の関数も書いて、現在の真魚に使用していると。 さて、このJIS変換についてだが、JISにも補助漢字領域ってのがあって対応したいし、 JIS規格だけでもいろんな種類があるしで、やはり自作しなきゃ満足な変換は出来ない。 しか…続きを読む
なんか文字コードに躍起になっているが、もともと萌ディタの開発日記が発端である。 http://www.geocities.co.jp/SiliconValley-Oakland/3617/progress_2004Q2.html EUCはSJISにない文字も扱える仕様に変更済み。 次にJISなんだが、そこに書いてあるようにいろいろあるわけだが、 読み込みについてはどんな実装をするか悩まずに出来た。 EUC変換のために作ったテーブルを使っ…続きを読む
EUCへの対応については、補助漢字領域の拡張を目的に進めてきた。 すなわち、旧来のSJIS変換を行うとEUCにしかない文字が失われてしまうので、 SJISを介さずにEUC<->ユニコード変換を行うように仕様変更だ。 それはもうできあがったからそれで良い。 次にJISへの対応をどうするかという話だ。 JISは多くの拡張がなされているため、全てに対応すれば中韓国語も扱えるはずだ。 だが、中韓国語拡張したJIS文字コードはどこで利用されるのか…続きを読む