検索結果

キーワード: ‘日記’

安易なネーミングのせいか、同名のあきらかに別のものがいろいろあるみたい。 そして、探しているメモ超には辿り着けないでいるのが、 どうしてそれを探しているのかという話。 真魚のソースの中に、自分用のURLメモが何カ所かあるわけだが、 その中の一つ、 http://www.uri.sakura.ne.jp/~cosmic/yuno/lab/ これが「ためになる」というコメント付でメモしてあった。 実際にためになる事がいっぱいあるのだが、一番…続きを読む

1869 letters | 510 views | コメントする

Alphaの日記をざっと読んだ。 難しすぎる話題が多く、ほとんど理解できないのだが、わかる部分は参考になった。 特に、インド方面の言語については知らなかったことを知れて満足している。 以前は不明だったこのエディタの存在意義、方向性が何となく見えてきた。 最初見たときは、スクリプト用のエディタなのにユニコードに注力して理解不能だった。 スクリプトとかプログラミングってむしろ、コンパイラとかが判定に失敗しないよう、 ANSIのみ、もしくはせ…続きを読む

どうするかどうするかと、考えるだけ考えて発動してなかったが、 ようやく着手し、まあまあ矛盾の少ない状態で動き始めた。 もうこれって出来ても出来なくても、試しに作ってみるしか納得出来なくなっちゃったし。 ダメなら隠し機能と言うことで封印しちゃえば良いんだし。 ウィンドウの実装は、萌ディタの開発日記を参考にして作った。 パクりではなく参考と表現したのは、 パクりたいけど意味わからなくて、完全にはパクれなかったから、 理解できるところまでの実…続きを読む

さて、8000文字テストで落ちないエディタを三つあげたわけだが、 その三つとも、80000文字テストを乗り切ることは出来なかった。 EmEditorの限界は74483文字で、それ以上だと「見つかりませんでした」が出るか、 条件は不明だが「Too Big」とかなんとかっていうダイアログが出るかする。 落ちるよりはヒットしない方が全然マシ。 萌ディタは、80000文字の貼り付けが出来なかくて「がっかり」ダイアログ。 仕方ないので8000文字…続きを読む

最初は、ヘルプに遅いと書いてあるから速くできるんじゃないかとか、 まだ対応してない物を自前で対応できないかとか、 そういうつもりで正規表現ライブラリの中身を検証していたはずだったが、 途中からはアプリが落ちるか落ちないかの話題に変ってしまったな。 で、一応解決したよ。現在は、8000どころか80000文字でも落ちないようになった。 もちろん、32bitを超える数字のケアはしてないので、そこであふれるだろうが。 32bit以上のケアしない…続きを読む

アプリが落ちる話なので、言いがかりだと言われないように、やり方を明確にしておく。 -(半角のマイナス)を8000文字入力する。コピペでも良い。 なぜ8000かというと、欠陥のあるライブラリでも数百ぐらいだとまだ耐えるからだ。 マイナスには特に意味はないが、改行が含まれると検索出来ない物もあるのでダメ。 で、8000文字入力したら先頭1文字目に入力位置をあわせ、 正規表現で(.|¥n)+を検索する。あえて全角で書いたがもちろん半角で。 す…続きを読む

難しい言葉で言うと再帰。 正規表現の検索では、普通の検索と違ってたくさんの枝分かれが起こる。 その分かれた枝からさらに別の枝分かれが起こる。 全部の枝を検証して最長一致を求めるっていう事をやらせるために、 TRegExprは再帰っていう方法を使っている。 マッチしているかどうかを判断すべきメソッドは、枝分かれ前の現在の枝しか評価せず、 枝分かれの分岐点からは、それぞれの枝について自分と同じ仕事をするメソッドに託す。 それれぞれの枝がさら…続きを読む

本当に、見えないところの変更はいっぱいやってるんだが、 それを変更したからって全然ありがたくないようなことばかりなんだよね。 バグは結構あって、気がつき次第直しているんだが、 そのほとんどは、作者だからこそ意図してない動作に気がついているが、 よその人が使う分には仕様かと思ってしまうようなくだらないことで、 だからこそ指摘されて直すのではなく、自分で気がついてばかりいる。 いくら真魚なんて使っている人がほとんどいないっていっても、 わか…続きを読む

なんか、更新した場所がたくさんあるので、ここらでいったん出しておく。 結構燃え尽きてるので次があるかはわからないが。 前回の2.08ではEmEditorフリー版に影響を受けた部分が多少あったわけだが、 今回は萌ディタの開発日記に影響を受けた部分がいっぱいある。 やっぱりユニコードでプロポーショナル対応なエディタは参考になるな。 SJISのエディタだと参考にしなくてもTEditorのソース読めばいいからね。 TEditorを研究してパクり…続きを読む

JISにもESC$(Dで補助漢字領域が使えるようなので、読み込み部分で対応した。 これで、EUCもJISも旧来の変換では切り捨てていた多くの文字に対応した事になる。 もちろんJISの書き出しはメーラー互換を前提にするので、補助漢字の書き出しはしない。 JISで使えないはずの規格外4文字が半角カタカナ周辺にあり、これも書き出さないことにした。 JISの変換はやはりSJISを経由にし、新たにテーブルを設けることはしなかった。 さてここで、ま…続きを読む

なんか文字コードに躍起になっているが、もともと萌ディタの開発日記が発端である。 http://www.geocities.co.jp/SiliconValley-Oakland/3617/progress_2004Q2.html EUCはSJISにない文字も扱える仕様に変更済み。 次にJISなんだが、そこに書いてあるようにいろいろあるわけだが、 読み込みについてはどんな実装をするか悩まずに出来た。 EUC変換のために作ったテーブルを使っ…続きを読む

まとめると、EUCをWindowsで扱う方法は三つ。 ○SJISに変換する。 SJISにはない補助漢字領域の文字は全て破棄する事になる。 ○EUC<->UTF16変換テーブルをアプリ内で持つ。 一番やりたいのはこれだが作業がつらい。 ○CP20932を使ってWindowsにやらせる。 本来のEUCでは補助漢字領域を3バイトで表すが、CP20932は2バイトで表す。 この2バイトと3バイトの相互変換が実に簡単な事がわかった。 CP2093…続きを読む

日本語文字コードって、WindowsではSJIS、UnixではEUCということだが、 インターネットが普及したおかげで、EUCをWindowsで扱う機会も増えてきたということだが、 EUCにはあってSJISにはない文字っていうのもあるってことを、萌ディタの開発日記で知った。 旧来のSJISのテキストエディタでは、SJISにない文字なんだから編集出来なくて当たり前で、 ”EUC対応”って書いていても特定の文字は変換できなくて切り捨ててきた…続きを読む

萌ディタの日記を読んだおかげで、コレまで知らなかったいろんな事が見えてきた。 作者さん相当賢いんだなぁ。復帰するのかしらねぇ。 で、真魚にも生かしたいのだが、タップリと書いたせいで自分で読み返すのが面倒だ。 気になる部分を自分のためにまとめてもう一回書く。 >EUC対応 真魚は、Delphiの世界ではスタンダードなjconvert.pasを高速化して使っている。 これって、EUCをSJISに変換するユニットだから、SJISに変換できない…続きを読む

1986 letters | 814 views | コメントする

テキストファイル内で改行を表す記号が統一されなくて困ると言う話。 真魚は、Windows、Windows以外、古いMacという、三つの表記を使っている。 まず、Unix系のパソコンでは、改行をLFという記号で表している。 インターネットとかが普及したせいで、LFの需要も高まってしまった。 次に、古いMacはCRという記号で改行を表していたのだが、 そのインターネット需要のためか、最近はLFに変更されているらしい。 コレが、Windows…続きを読む