メモ超って?
安易なネーミングのせいか、同名のあきらかに別のものがいろいろあるみたい。
そして、探しているメモ超には辿り着けないでいるのが、
どうしてそれを探しているのかという話。
真魚のソースの中に、自分用のURLメモが何カ所かあるわけだが、
その中の一つ、
http://www.uri.sakura.ne.jp/~cosmic/yuno/lab/
これが「ためになる」というコメント付でメモしてあった。
実際にためになる事がいっぱいあるのだが、一番下、「メニューへ戻る」をクリックすると。
「移転しました」とあり、移転先には同じものが置いてない。
すなわち、この移転前の場所にある「ためになる」ページは、いつ消えてもおかしくない。
もったいないので、早々になにか書いておきたい。
ちなみに移転先の方にもいろいろためになることが書いてあるのに、
日記に「移行中」と書いてあり、なんで移転ばっかりしてるんだよと。
しかも*.sakura.ne.jp内でばかり。
ともかく、まぁ見所は色々とあるのだが、特にUnicodeの欄だな。
http://www.uri.sakura.ne.jp/~cosmic/yuno/lab/unicode_glyph.html
ドイツ語のü(ウー・ウムラウト)を例に話している。
先日真魚でフランス語の入力を試したときは別に何ともなく、普通に入力できたが、
>合成済み文字は既存の文字コードとの互換性のためだけに用意
だそうで、その合成済みの方が入力されたから何ともなかっただけで、
ウーとウムラウトが一文字ずつ入力されるIMEには(あるのか?)真魚は対応できない。
そこでまたよそのテキストエディタで実験だ。
u ̈ u ̈(ウー、ウムラウト、ウー、ウムラウトの4キャラクタ)をくっつけて入力する。
真魚では素直に、4グリフが表示され、ウムラウト部分はただの記号扱い。
これは間違いだが、正しい表示はこれからもしようと言う予定はない(後述)。
これをメモ帳に貼り付けてみると、見た目はüü(ウー・ウムラウト、ウー・ウムラウト)になる。
さすがOS付属のソフトはすごいぜ。
で、例によってEmEditor Free版だが、これも見た目はüüになる。
が、ちょっと触ってみると挙動があやしく、ウーとウムラウトの間に移動できる。
範囲選択しようとすると、uと非表示文字に分離されてしまうようだ。
また、ウーとウムラウトの間にaを入力すれば、uäになってしまう。
日本語で言えば、「が」の「か」と「゛」の間に「き」を入れて「かぎ」になるようなもので、
たぶんEmEditorの動作は不正解だろう。
Unicodeといえば、Unicodeへの対応で差別化を狙っていると書いてあったAlphaだが、
フォントによって対応したりしなかったりするようだ。
初期のTerminalだと、u■u■と表示されるが、Tahomaに変えたらバッチリだった。
メモ帳と同様、ウーとウムラウトの間にカーソルが移動しないようになっていて、
使っている側からは2キャラクタか1キャラクタかの区別が付かない。
ということは?と、メモ帳もTerminalに変えたらu■u■になったのだが、
なんと、この状態だとウーとウムラウトの間に移動できたのだ。
メモ帳はフォントによって動作まで変えるってことか。
じゃあひょっとして折り返しの実験も、フォント変えて再試行が必要なのかも。
とにかく、真魚が対応してないユニコードの例が一つ書いてあってためになる。
次にサロゲート。
http://www.uri.sakura.ne.jp/~cosmic/yuno/lab/unicode_surrogates.html
真魚は、表示と編集についてはSJISのエディタと同等レベルの実装しかする気はなく、
日本語しかわからないからって、日本語以外の部分を全部破壊するのではなく、
一切手出ししなければ一切破壊しないものをとにかく必要としていた。
よって、はじめから16ビット固定長を脱する気も、2キャラ1グリフをやる気もない。
やる気はないけど、こういう事もあるんだなとためになる。
>過去はバッサリ切り捨てて1文字32ビットの世界へ行く。メモ超はこれです。
というわけで出てきたよ「メモ超」が。
これ、「メモ超」という名の、内部32ビット文字なメモ帳を作ったと読めるのだが。
ブツには辿り着けないな。
あたしの知る限り、ファイルや内部データを32ビットで保持しても、
WindowsのAPIが16ビットだから変換してやらなきゃいけなくて、
現時点では32ビットのユニコードを扱うメリットを感じないわけで、
そんな中、32ビットの世界へ言ったソフトを作ったのなら興味を持って当然だ。
というわけで、もったいない場所に書いてあった、ためになる話に勝手にコメントした。