検索結果

キーワード: ‘方法’

難しい言葉で言うと再帰。 正規表現の検索では、普通の検索と違ってたくさんの枝分かれが起こる。 その分かれた枝からさらに別の枝分かれが起こる。 全部の枝を検証して最長一致を求めるっていう事をやらせるために、 TRegExprは再帰っていう方法を使っている。 マッチしているかどうかを判断すべきメソッドは、枝分かれ前の現在の枝しか評価せず、 枝分かれの分岐点からは、それぞれの枝について自分と同じ仕事をするメソッドに託す。 それれぞれの枝がさら…続きを読む

1708 letters | 608 views | コメントする

TEditorを使っていた真魚1.xxでの仕様は、元のテキストがどの改行を使っていても、 読み込んだ時点でCRLFにしてしまって、EUCで保存するときのみLF統一で、 それ以外の文字コードではCRLFで保存しちゃうということで、 WindowsのエディタなんだからWindows風の処理をするのは当たり前で、 唯一Windows以外で使うことがはっきりしているEUCでのみ、ケアしてあげる方法にしてた。 バージョン2.xxでは、どの改行コー…続きを読む

これもSJISのエディタでは特に考えなくてもいい話だ。 アルファベットが連続していたら、その途中で折り返したらいけないってだけ。 その際、どれがアルファベットの文字なのかってのは単純なんだよね。 SJISには半角と全角のアルファベットがあり、 半角のアルファベットは途中で折り返しちゃいけなくて、全角は折り返し出来る。 そもそも全角のアルファベットはSJISの文書では使えるけど、ASCIIでは使えない。 だから、全角の文字は日本語流の折り…続きを読む

EUCへの対応については、補助漢字領域の拡張を目的に進めてきた。 すなわち、旧来のSJIS変換を行うとEUCにしかない文字が失われてしまうので、 SJISを介さずにEUC<->ユニコード変換を行うように仕様変更だ。 それはもうできあがったからそれで良い。 次にJISへの対応をどうするかという話だ。 JISは多くの拡張がなされているため、全てに対応すれば中韓国語も扱えるはずだ。 だが、中韓国語拡張したJIS文字コードはどこで利用されるのか…続きを読む

JISX0212の補助漢字領域の資料が正しいかどうかはわからないが、 JISX0208の第一水準、第二水準漢字領域については、 資料には不備が多すぎて使い物にならなかったと言うことで、 CP50220を使って、OSにJISX0208領域を実際に変換させてテーブルを作成させた。 そしたら、CP20932を使ったときと同様、それと同じ文字で問題があった。 これも、SJIS経由での変換とは多少違った物を作ってしまった。 いや、多少かどうかは知…続きを読む

二つの方法がダメになった。 ○SJISを経由すると補助漢字が失われる。 ○CP20932でもうまくいかない。 で、最後の方法として、 ○アプリが変換テーブルをもつ。 コレをやるにあたり、 http://www.unicode.org/Public/MAPPINGS/OBSOLETE/EASTASIA/JIS/ にあるテキストファイルを使用した。 矩形選択と正規表現置換で、完璧にDelphiコードに変換できた。 そして実際に正しい変換が出…続きを読む

まとめると、EUCをWindowsで扱う方法は三つ。 ○SJISに変換する。 SJISにはない補助漢字領域の文字は全て破棄する事になる。 ○EUC<->UTF16変換テーブルをアプリ内で持つ。 一番やりたいのはこれだが作業がつらい。 ○CP20932を使ってWindowsにやらせる。 本来のEUCでは補助漢字領域を3バイトで表すが、CP20932は2バイトで表す。 この2バイトと3バイトの相互変換が実に簡単な事がわかった。 CP2093…続きを読む

つづき。 現在、萌ディタも起動していじりながら、コレは真魚で書いてる。 ここまでで萌ディタの「がっかり」すなわち不正終了が二回出た。 http://www.geocities.co.jp/SiliconValley-Oakland/3617/progress_2004Q2.html >ルーラの存在は微妙 あたしもEmEditor式は相当違和感がある。真魚はTEditorのパクリ式。 何文字目で折り返してるか見たり、実際に折り返したりする…続きを読む

やっぱりフォントの扱いはハンパじゃなく難しい。 この画像で何をやっているかというと、文字の並び方で幅が変っちゃうという検証。 真魚の内部では、「て」の文字幅と「し」の文字幅をいったん算出しちゃったら、 その文字幅を覚えておくことで、「て」や「し」が何度出てきても算出ナシで描画している。 文字幅を全部計算してたら激遅なので、1文字につき計算するのは1度きりだ。 それでうまくいくフォントもあれば、うまくいかないフォントもあるってこと。 2行…続きを読む

あたしゃ普段からATOKを使っているのだが、今日は動作確認もかねてNatural Inputで書く。 まず、真魚にTEditorを使っていた時代の話にさかのぼる。 再変換自体が、Win98以降だったか、それともMS-Office付属のIMEだったかで初登場した頃、 Win95とかそれ以前の時代から一太郎&ATOK使ってるあたしゃその存在自体を知らなかった。 古くからパソコン使ってて、それまでの文字入力に変化があるとは思ってもいない状態だ…続きを読む

先日から、Googleでsite:wantech.ikuto.comの結果がおかしな事になっている。 まだ不安定期っぽいので経過を正確にはメモっていないが、 まず、日本語ページからの検索で通常のキャッシュつきは約80ページほど、 8月のキャッシュが表示される「補足結果」が数十ページ、合計140ページぐらいになってた。 以前は、この検索方法では補足結果が表示されていなかったので、 補足こみでならインデックス増加、メインインデックス自体は減…続きを読む

SJIS外の文字幅計算が目的だったが、やってみたら大してボトルネックにならないようだし、 せっかく幅を取得してキャッシュするし、真魚はプロポーショナルフォントに対応しちゃった。 記事:フォントの幅計算 仕組み上は出来そうだったので、早速作ってみた。 http://mana.ikuto.com/ 事務所や自宅のパソコンでは遅くなったとは体感できないが、非力なマシンではどうかな。 これまで、真魚の動作で遅くなりそうなところと言えば、文字を画…続きを読む

真魚というか、TNotePadでは等幅フォントでないとマトモな文字幅にならない。 これは、全ての文字を半角か全角かという2種類の横幅に分類しちゃうことで、 いちいち文字の幅を計算しなくても良くなるので、その分高速な処理をしているのだ。 まぁ、内部は結構な量でTEditorのパクリがあるわけだから仕方がない。 ただ、SJIS外の文字幅は、フォントの種類によって異なるという問題がある。 その実例がコレ。 http://wantech.iku…続きを読む

ダウンロード 要.NET Framework 2.0(再頒布可能パッケージ) C#2005がどんな感じだか、無料版で試してみるにあたり、 不動産屋らしく、住宅ローンの元利均等返済用に計算機を作ってみた。 元利均等ってのは、毎回同じ金額返済する方法で、銀行から借りると大概コレ。 ボーナス返済まで考慮すると計算が複雑になるので省略した。 さて2005だが、フォームに部品を並べる際に青い線が出てそろえてくれるとか、 算式をスペース開けないで書…続きを読む

まだ12月が終わってないが。 嫁が新刊を出したにもかかわらず、嫁のブログからアマゾンでの購入者はたった一人。 どいつもこいつも書店で購入しているらしい。 著者本人のブログですら、その著書を売ることが出来ていないのに、 著者でもないのにアマゾンにリンク貼ってどれほど儲けることが出来るというのか。 嫁は先日、アマゾンで本を購入する方法がわからず、あきらめて書店に行った。 ひょっとしてさ、アマゾンはクリックされてから購入決定まで難しすぎるんじ…続きを読む