検索結果

キーワード: ‘euc’

いや、これまでもVBだったというべきか。 VBを必要とする人がいる限り、将来も反映していきそうなので、 あたしゃC#で部品を作るだけだが、VB向けに何か配布していこうかと。 理想としては、TEditorのようにエディタコンポそのものの配布だが、 現在の.NET 2.0では機能不足でWin32に依存しなきゃ作れない部分が多いことと、 パフォーマンスで劣っていることは、「ぎょえ」を作って知っているから、 それはとりあえず後回しにしても、他に…続きを読む

しばらく間が空いたのでおさらいからだ。 この話は、既存のEUC変換では対応してない補助漢字領域に対応することから始まった。 既存の方法では対応してないので、対応するように関数を書いたわけだ。 そのついでとして、JIS変換の関数も書いて、現在の真魚に使用していると。 さて、このJIS変換についてだが、JISにも補助漢字領域ってのがあって対応したいし、 JIS規格だけでもいろんな種類があるしで、やはり自作しなきゃ満足な変換は出来ない。 しか…続きを読む

最初に.NETが出てきた頃の予想では、世の中には.NET製アプリしかなくなるはずだった。 初心者はVB.NETで、それ以外の人はC#で開発を行い、 DelphiユーザーもDelphi.NETへ移行するのが当たり前かと思っていたんだよな。 ところが現状は、.NETライブラリがVBランタイムに置き換わっただけだった。 C#でテキストエディタ作ってみたのに問題ありすぎで、 同じものならDelphiの方が良くて移植しちゃったし。 まだ.NET …続きを読む

最初は正規表現か何かがらみでググっていたときに遡る。 TEditorを使わなくなって以来見てなかった、とあるサイトでDelphiから鬼車ってのをやてて、 その進行度合いを注目していたのだが、そこのBBSが毎日エロサイト宣伝の爆撃にあっている。 もうね、必要な情報を探す方が困難なくらいにエロ宣伝で、掲示板が使い物にならない。 たいへんだなぁと人ごとのように思っていたんだがね、 放置して気がつかなかっただけで、自分のサイトも毎日爆撃されてる…続きを読む

先日のコレ。 記事:文字化け投稿をどうするか 迷惑投稿が出来るのは、携帯からの投稿を装ってるからなのではないかと推測した。 実際、携帯を装えばリファラのチェックはスルーできたので、そこをせき止めてみたのだが、 その後も普通に迷惑投稿があったので、鯖のログを見てみると、 別に携帯でも何でもなく、普通にブラウザからの投稿と区別できないような状態だった。 いや、簡単に区別する方法はあるんだぜ。 なんせ、投稿フォームにGETアクセスせずに、いき…続きを読む

つい最近作った部分で、もう判定に失敗することもないんだろうと思っていたが、 先ほど真魚で判定に失敗して文字化けさせてしまった。 そのファイルが、なぜ判定失敗したかは既にわかったので、それについての話。 とりあえず、今やってる文字コード判定のソースに書いたコメントを転載。 //実際の所この関数はどう動くのか //lenの長さかValueの長さか、小さい方をゴールとする。 //Resultの初期値はASCIIにする。 //アルファベットなど…続きを読む

やる気がないときは一切やらないのに、いったんハマると抜けられないな。 折り返しやEUC関連の修正と変更は、手作業でばかりやっていたわけではない。 数万の文字についてそれが何語だとか記号だとか、変換先がどこだとか、 人間様が手作業で分類してたら気が遠くなるわけで、 既に他人によって分類されたデータを利用しやすいように編集するという作業は、 それ専用にプログラムを書いてやらせたりとかしているわけだ。 プログラムをプログラムに書かせるみたいな…続きを読む

1708 letters | 608 views | コメントする

TEditorを使っていた真魚1.xxでの仕様は、元のテキストがどの改行を使っていても、 読み込んだ時点でCRLFにしてしまって、EUCで保存するときのみLF統一で、 それ以外の文字コードではCRLFで保存しちゃうということで、 WindowsのエディタなんだからWindows風の処理をするのは当たり前で、 唯一Windows以外で使うことがはっきりしているEUCでのみ、ケアしてあげる方法にしてた。 バージョン2.xxでは、どの改行コー…続きを読む

JIS/EUC変換読み書き部分を作り直し、今まで対応してなかった文字に対応したので、 文字コード自動判定部分も、新たに対応した領域を使いたい。 jconvert.pasは結構古いものなので、 JIS、EUCを検出することは出来ても、UTF-8やUTF-7を自動判定することは出来ず、 真魚では、まずjconvert.pasの判定もして、 しかも自前で書いたUTF-7とUTF-8の判定をもするという形をとっているわけだが、 全部まとめて1p…続きを読む

JISにもESC$(Dで補助漢字領域が使えるようなので、読み込み部分で対応した。 これで、EUCもJISも旧来の変換では切り捨てていた多くの文字に対応した事になる。 もちろんJISの書き出しはメーラー互換を前提にするので、補助漢字の書き出しはしない。 JISで使えないはずの規格外4文字が半角カタカナ周辺にあり、これも書き出さないことにした。 JISの変換はやはりSJISを経由にし、新たにテーブルを設けることはしなかった。 さてここで、ま…続きを読む

なんか文字コードに躍起になっているが、もともと萌ディタの開発日記が発端である。 http://www.geocities.co.jp/SiliconValley-Oakland/3617/progress_2004Q2.html EUCはSJISにない文字も扱える仕様に変更済み。 次にJISなんだが、そこに書いてあるようにいろいろあるわけだが、 読み込みについてはどんな実装をするか悩まずに出来た。 EUC変換のために作ったテーブルを使っ…続きを読む

EUCへの対応については、補助漢字領域の拡張を目的に進めてきた。 すなわち、旧来のSJIS変換を行うとEUCにしかない文字が失われてしまうので、 SJISを介さずにEUC<->ユニコード変換を行うように仕様変更だ。 それはもうできあがったからそれで良い。 次にJISへの対応をどうするかという話だ。 JISは多くの拡張がなされているため、全てに対応すれば中韓国語も扱えるはずだ。 だが、中韓国語拡張したJIS文字コードはどこで利用されるのか…続きを読む

萌ディタの日記を読んだおかげで、コレまで知らなかったいろんな事が見えてきた。 作者さん相当賢いんだなぁ。復帰するのかしらねぇ。 で、真魚にも生かしたいのだが、タップリと書いたせいで自分で読み返すのが面倒だ。 気になる部分を自分のためにまとめてもう一回書く。 >EUC対応 真魚は、Delphiの世界ではスタンダードなjconvert.pasを高速化して使っている。 これって、EUCをSJISに変換するユニットだから、SJISに変換できない…続きを読む

つづき。 現在、萌ディタも起動していじりながら、コレは真魚で書いてる。 ここまでで萌ディタの「がっかり」すなわち不正終了が二回出た。 http://www.geocities.co.jp/SiliconValley-Oakland/3617/progress_2004Q2.html >ルーラの存在は微妙 あたしもEmEditor式は相当違和感がある。真魚はTEditorのパクリ式。 何文字目で折り返してるか見たり、実際に折り返したりする…続きを読む