アーカイブ

2006年 のアーカイブ

自体はどんどん複雑化する。 ユニコードの私用領域であるU+E000辺り以降が、SJISやJISへ変換出来ると言うことを、 ATOKの文字パレットで確認したが、JISの規格では使われていない、 0x7F21から0x927Eまでが割り当てられているようだ。 EUCでは、JISでの0x2121~0x7E7Eに0x8080を加えた、0xA1A1~0xFEFEを使っているので、 規格をはみ出して私用領域を割り当てようとすると桁があふれてしまうのだ…続きを読む

JISX0212の補助漢字領域の資料が正しいかどうかはわからないが、 JISX0208の第一水準、第二水準漢字領域については、 資料には不備が多すぎて使い物にならなかったと言うことで、 CP50220を使って、OSにJISX0208領域を実際に変換させてテーブルを作成させた。 そしたら、CP20932を使ったときと同様、それと同じ文字で問題があった。 これも、SJIS経由での変換とは多少違った物を作ってしまった。 いや、多少かどうかは知…続きを読む

二つの方法がダメになった。 ○SJISを経由すると補助漢字が失われる。 ○CP20932でもうまくいかない。 で、最後の方法として、 ○アプリが変換テーブルをもつ。 コレをやるにあたり、 http://www.unicode.org/Public/MAPPINGS/OBSOLETE/EASTASIA/JIS/ にあるテキストファイルを使用した。 矩形選択と正規表現置換で、完璧にDelphiコードに変換できた。 そして実際に正しい変換が出…続きを読む

一見かなりまともそうだったのだが、いくつかの文字がどうしようもなかったりした。 補助漢字部分の拡張が目的ではあるが、それにより今まで変換できた文字が出来なくなる。 WideCharToMultiByteで、UTF-16からSJISへの変換に成功した文字の内、 UTF-16からEUCへの変換に失敗したのは、「昴」「~」とか14文字だ。 逆にそれらを、MultiByteToWideCharで、EUCからUTF-16に変換すると、 似て非なる…続きを読む

まとめると、EUCをWindowsで扱う方法は三つ。 ○SJISに変換する。 SJISにはない補助漢字領域の文字は全て破棄する事になる。 ○EUC<->UTF16変換テーブルをアプリ内で持つ。 一番やりたいのはこれだが作業がつらい。 ○CP20932を使ってWindowsにやらせる。 本来のEUCでは補助漢字領域を3バイトで表すが、CP20932は2バイトで表す。 この2バイトと3バイトの相互変換が実に簡単な事がわかった。 CP2093…続きを読む

日本語文字コードって、WindowsではSJIS、UnixではEUCということだが、 インターネットが普及したおかげで、EUCをWindowsで扱う機会も増えてきたということだが、 EUCにはあってSJISにはない文字っていうのもあるってことを、萌ディタの開発日記で知った。 旧来のSJISのテキストエディタでは、SJISにない文字なんだから編集出来なくて当たり前で、 ”EUC対応”って書いていても特定の文字は変換できなくて切り捨ててきた…続きを読む

萌ディタの日記を読んだおかげで、コレまで知らなかったいろんな事が見えてきた。 作者さん相当賢いんだなぁ。復帰するのかしらねぇ。 で、真魚にも生かしたいのだが、タップリと書いたせいで自分で読み返すのが面倒だ。 気になる部分を自分のためにまとめてもう一回書く。 >EUC対応 真魚は、Delphiの世界ではスタンダードなjconvert.pasを高速化して使っている。 これって、EUCをSJISに変換するユニットだから、SJISに変換できない…続きを読む

コントロールパネルから地域と言語のオプションを選び、 言語タブからテキストサービスと入力の詳細をクリック。 設定タブで追加をクリックし、中国語やフランス語を追加する。 で、真魚への入力を中国語に切替し、 ni(Enter)hao(Enter×2) で、你好(ニーハオ)が打てる。 ハングルは読むことすら出来ないが、同様に入力は可能。 次にフランス語に切替、Pの隣の@押してからA押すとâ(aの上に^)が、 右Alt+;押してからo押すとó(…続きを読む

フリーソフトをVectorに登録しておくと、たまにレビューワーの人が記事を書いてくれる。 あたしの作ったソフトも何個か記事を書いて貰ったんだがね。 真魚の記事をもう一回書き直して貰えるらしい。 そこに、作者のひとことってのを載せてもらえるんだが、 普段自分のサイトには何でも好きなこと書いて気をつかってないんだけど、 いちおうよそのサイトに書くんだし、いったん書いたら自分で好きに修正できないので、 誰の悪口にもならないよう、一生懸命に気を…続きを読む

1986 letters | 814 views | コメントする

テキストファイル内で改行を表す記号が統一されなくて困ると言う話。 真魚は、Windows、Windows以外、古いMacという、三つの表記を使っている。 まず、Unix系のパソコンでは、改行をLFという記号で表している。 インターネットとかが普及したせいで、LFの需要も高まってしまった。 次に、古いMacはCRという記号で改行を表していたのだが、 そのインターネット需要のためか、最近はLFに変更されているらしい。 コレが、Windows…続きを読む

なぜ今更かというと、Firefoxで本体を安易にアップデートしたらプラグインが使えなくなったから。 いや、数字を直すだけで使えるようになるものでも、数字で制限されたりしてるわけで。 しかし数字だけ直して無理矢理対応も出来ないものがあるわけで。 よって、余計なプラグインは入れない事で体を慣らす必要もあるな。 Thunderbirdで使ってきたのはたったの三つ。 「全て受信」できるMagicSLRは頻繁に更新してるようなので問題ない。 Sh…続きを読む

つづき。 結局全部読んだ。参考になりまくった。 http://www.geocities.co.jp/SiliconValley-Oakland/3617/progress_2004Q4.html http://www.geocities.co.jp/SiliconValley-Oakland/3617/progress_2005Q1.html http://www.geocities.co.jp/SiliconValley-Oakla…続きを読む

つづき。 難しい話が多くなってきて、読んでもわからないことも多い。 http://www.geocities.co.jp/SiliconValley-Oakland/3617/progress_2004Q3.html >ぎょえ(仮)がちょっと楽しみだったりします もう.NETのぎょえは継続する気がなくて真魚だがな。 >ショートカットファイルをドロップしたとき テキストを含む、ドキュメントファイルのショートカットを作ったことがないので気が…続きを読む

つづき。 現在、萌ディタも起動していじりながら、コレは真魚で書いてる。 ここまでで萌ディタの「がっかり」すなわち不正終了が二回出た。 http://www.geocities.co.jp/SiliconValley-Oakland/3617/progress_2004Q2.html >ルーラの存在は微妙 あたしもEmEditor式は相当違和感がある。真魚はTEditorのパクリ式。 何文字目で折り返してるか見たり、実際に折り返したりする…続きを読む

よそのエディタの開発日記を読んで、参考になることはパクろうと言うついでに、 問われてもいないのにいちいち反応してみようかと。 http://www.geocities.co.jp/SiliconValley-Oakland/3617/progress_2004Q1.html >ファンクションキー よく使う機能は、Ctrl+ナントカでなくてFnに割り当てして、さらにShiftとかの組み合わせも利用し、 ファンクションキーに何が割り当てられ…続きを読む