検索結果

キーワード: ‘euc’

最近のWindowsでは、メモ帳でもそれなりに大きなファイルが開けるようになり、 「メモ帳では開けません」という警告が出なくなったので、メモ帳代替ソフトの需要は減ったはずだ。 新しいパソコンユーザーは、メモ帳が不便だと感じる機会さえあまりないだろう。 必要がないのに、わざわざメモ帳を置き換えるのは面倒だ。 なにかメモ帳ではできなことがしたくなってこそ、メモ帳代替ソフトが必要になるわけで、 それが昔だと、扱えるファイルサイズが小さいことだ…続きを読む

ようやく満足のいくEUC対応ができあがったようだ。 が、乗りかかった船なのでもうちょっと調べている。 http://kanji.zinbun.kyoto-u.ac.jp/~yasuoka/kanjibukuro/japan.html これのEUC-JPとShift_JISのところに、ちょっと納得いくことが書いてあった。 >いずれを使うかは、使う人の自由にまかされます。 なるほどな。 DelphiアプリでのEUC変換は、jconvert.…続きを読む

自体はどんどん複雑化する。 ユニコードの私用領域であるU+E000辺り以降が、SJISやJISへ変換出来ると言うことを、 ATOKの文字パレットで確認したが、JISの規格では使われていない、 0x7F21から0x927Eまでが割り当てられているようだ。 EUCでは、JISでの0x2121~0x7E7Eに0x8080を加えた、0xA1A1~0xFEFEを使っているので、 規格をはみ出して私用領域を割り当てようとすると桁があふれてしまうのだ…続きを読む

JISX0212の補助漢字領域の資料が正しいかどうかはわからないが、 JISX0208の第一水準、第二水準漢字領域については、 資料には不備が多すぎて使い物にならなかったと言うことで、 CP50220を使って、OSにJISX0208領域を実際に変換させてテーブルを作成させた。 そしたら、CP20932を使ったときと同様、それと同じ文字で問題があった。 これも、SJIS経由での変換とは多少違った物を作ってしまった。 いや、多少かどうかは知…続きを読む

二つの方法がダメになった。 ○SJISを経由すると補助漢字が失われる。 ○CP20932でもうまくいかない。 で、最後の方法として、 ○アプリが変換テーブルをもつ。 コレをやるにあたり、 http://www.unicode.org/Public/MAPPINGS/OBSOLETE/EASTASIA/JIS/ にあるテキストファイルを使用した。 矩形選択と正規表現置換で、完璧にDelphiコードに変換できた。 そして実際に正しい変換が出…続きを読む

一見かなりまともそうだったのだが、いくつかの文字がどうしようもなかったりした。 補助漢字部分の拡張が目的ではあるが、それにより今まで変換できた文字が出来なくなる。 WideCharToMultiByteで、UTF-16からSJISへの変換に成功した文字の内、 UTF-16からEUCへの変換に失敗したのは、「昴」「~」とか14文字だ。 逆にそれらを、MultiByteToWideCharで、EUCからUTF-16に変換すると、 似て非なる…続きを読む

まとめると、EUCをWindowsで扱う方法は三つ。 ○SJISに変換する。 SJISにはない補助漢字領域の文字は全て破棄する事になる。 ○EUC<->UTF16変換テーブルをアプリ内で持つ。 一番やりたいのはこれだが作業がつらい。 ○CP20932を使ってWindowsにやらせる。 本来のEUCでは補助漢字領域を3バイトで表すが、CP20932は2バイトで表す。 この2バイトと3バイトの相互変換が実に簡単な事がわかった。 CP2093…続きを読む

日本語文字コードって、WindowsではSJIS、UnixではEUCということだが、 インターネットが普及したおかげで、EUCをWindowsで扱う機会も増えてきたということだが、 EUCにはあってSJISにはない文字っていうのもあるってことを、萌ディタの開発日記で知った。 旧来のSJISのテキストエディタでは、SJISにない文字なんだから編集出来なくて当たり前で、 ”EUC対応”って書いていても特定の文字は変換できなくて切り捨ててきた…続きを読む

1788 letters | 1001 views | コメントする

 Google日本語入力で全半角キーを押したときにフキダシが表示されるようになってるから、有料のATOKをやめて無料のGoogleに移行しても良いかなぁと思ってしばらく使ってみたのだが、どうやらまだ個人的にATOKじゃないといけない部分があるようだ。個人的にと言うのは、契約書を作成するという業務があるため、人名の変換能力が高い方が有利だという点だね。先日、契約書にATOKで「礼子」という人名を使ったわけだが、これはたぶん「礼子」のしめす…続きを読む

 これまでは新規ファイルやマルチバイト文字を含まないファイルを最初からSJISとして扱ってきたが、真魚の内部をざっと確認したところ、文字コード未定のファイとして扱うように容易に変更することが出来た。さらに、この文字コード未定のファイルにマルチバイト文字を書き込んでセーブしようとする場合だけ、Windows標準で保存するかホームページなどの標準で保存するかの確認ダイアログを出すという風にしてみた。で、ひょっとしたらこのダイアログをいちいち…続きを読む

2618 letters | 1833 views | コメントする

 例えばこの日記はWordPressを使ってるが、ソースをいじる場合はUTF-8にしなきゃいけない。プラグインでもなんでも、元のソースは日本人が書いてる事は少なく、たいがいはマルチバイト文字を含んでいないため、これを真魚で開くとSJISと判定される。そこに自分でマルチバイト文字を書いて保存すると、UTF-8じゃなきゃいけないのにSJISになるわけだ。真魚の動作としては何らミスしてはいない。これはしょうがないことだ。でも、自分で使う上でさ…続きを読む

 pesterousっていうブログっぽいサービスは、メールで投稿できる事を一番の売りにしているのか、それともposterousを紹介してるサイトがメール部分をやたらピックアップしてるか、あたしにはブラウザ投稿よりメール投稿で行きたいサービスのように認識された。日本語に対応しているとはどこにも書いてないが、ブログタイトルとかは普通に日本語に変更する事ができた。でもいざメールで投稿してみると、本文は大丈夫だけどタイトルが文字化けしてる。=?…続きを読む

不動産屋は三月が一番忙しいのだが、なぜか三月が一番プログラミングもしたくなる。 現在の真魚のエディタエンジンを作り始めたのも三月だったな。 案の定、今年もちょっと真魚をいじり始めた。 12月に予告した二つの部分をいじり終わった。 一つは、Yahoo!辞書への文字列の転送方法だ。 Yahoo!はなんか昔からEUCにこだわっていて、サイトのエンコードもEUCだったので、 わざわざEUCにエンコードしてから開いていたが、いつしかUTF-8がデ…続きを読む

とりあえず管理ページ内の居住用賃貸部分は作り終えたと言うことで、 実際にXREAにアップして動かしてみた。 まず、つまずいたのは複数データベースを使う設定。 既にYomi-Searchにデータベースを使っているので、別のデータベースを使いたい。 XREAでは5個までデータベースを使えると言うことで、それは問題ないのだが、 いざやってみようとすると、思い通りいかなくて泣きそうになった。 ひとつめのデータベースを作るときはどうだったか思い出…続きを読む

例えばエロペガは、DirectX9の一部である、DirectShowを使って動画を再生している。 Delphiで動画を再生するための機能をまとめて、部品として公開してる人がいて、 エロペガにその部品を組み込んだ上で、ツマミとかは自分で作って出来上がりって感じだ。 部品、すなわちコンポーネント、略してコンポの単位で作れるのがDelphiの良いところ。 エロペガのツマミはもともと、VSTiを作るために使ったもので、その部品を再利用したもの。…続きを読む