アーカイブ

2012年 4月 3日 のアーカイブ

 pesterousっていうブログっぽいサービスは、メールで投稿できる事を一番の売りにしているのか、それともposterousを紹介してるサイトがメール部分をやたらピックアップしてるか、あたしにはブラウザ投稿よりメール投稿で行きたいサービスのように認識された。日本語に対応しているとはどこにも書いてないが、ブログタイトルとかは普通に日本語に変更する事ができた。でもいざメールで投稿してみると、本文は大丈夫だけどタイトルが文字化けしてる。=?ISO-2022なんちゃらって書いてるって事は、ヘッダがJISエンコードされて送られているのを、posterousはデコードしないでタイトルにしてるって事だ。日本ではメールはJIS、WindowsテキストファイルはS-JIS、ホームページはEUCと、三つのエンコードが並立して存在してて、特に断りがなければメールは当たり前にJISで書く物だし、ホームページはEUCで書く物だっていう暗黙のルールがあったわけだが、最近はホームページに関してはUTF-8にシフトしてるし、メールだってべつにUTF-8で送っちゃいけない事はない。posterousの文字化けを避けるために、一回UTF-8で連携メールを送ってみるかっていうテストがこの投稿の理由だ。

 ところがこれをやるには問題があって、WordPressにはデフォルトで日本語用プラグインが同梱してあり、日本語で使うなら例外なくオンにすべき物なんだけど、何も設定しなければ全てのメールを強制的にJISで送るようになっている。UTF-8で送るためには設定ファイルに違う値を入れれば良いんだけど、それが問題。posterousへメールを送るときだけUTF-8にしたくて、他の所に送る場合は今まで通りJISで送ってもらわないと、JISで正常動作していた連係先がUTF-8で化けるかも知れないんだよ。だから、引数か何かで一時的にUTF-8に出来たらいいんだけど、WordPressのオリジナル関数をハックしてるという仕組み上、そうも行かない。だので、まぁどういう仕組みになってるか知らないけど、プラグインの自動判別に任せてみる事にした。おそらく、メールに「汁么ゴ魚」って書けば、日本語にない文字だから自動でUTF-8になり、そういうのを含まない普段のメールはぜんぶJISで送ってくれるだろうと期待している。やってみなきゃわからないのでこれをテスト。

[amazonjs asin="4799311360" locale="JP" title="記録するだけでうまくいく"]

 そこまではまぁいいとして、化けるなら本文にタイトルを書けば良いんだし、大した問題ではないが、それよりも、メールの投稿先がバレバレすぎる事だ。あたしのメールアドレスを知ってる人は、誰でもあたしのメールアドレスを語ってなりすまし投稿できるってシステムだとしたら、それを防ぐためにposterous専用秘密アドレスで登録しなきゃいけなくなる。だので普通は、というか常識的に、posterousはなりすましの投稿を厳しくチェックしてないと、システムが成り立たないはずだ。だったら、WordPressから連携で自動送信されるメールを受け付けるわけがない。これが通るんだったら、よその人でも誰でも、レンタルサーバーにWordPressを入れてwp_mailって書けばposterousになりすまし投稿できちゃうじゃん。だから、この投稿に連携して送られる自動送信メールは、posterousになりすましと判断されてはねられて当たり前だ。文字化けがどうのと心配してるレベルじゃない。

 いずれにしても、posterous以外で海外ブログにメールで連携するかも知れないから、強制的にJISにする設定はオフにするわけで、それで国内各社のブログにうまく投稿できるかのテストをしなきゃいけないので、ついでにposterousについて書いたような物だ。

 あと、このposterousにはXML-RPCの受信じゃなく送信の機能がついてて、posterousに書けばXML-RPC対応のブログに複数同時連携ができる仕組みだ。あれ、そういえばあたしも今日か昨日、各ブログがそういう仕組みを搭載する時代が来るだろうって書いたっけ。もう来てたんだな。なりすまし投稿で他人のposterousに投稿できれば、そこだけじゃなくさらに連携先全部になりすまし投稿できちゃうわけで、まぁ、WordPressからのメールは弾かれるはず。

追記:

 ありゃーwp_mailできてしまった。これ、誰でもなりすまし投稿できるわ。あとタイトルに入れた[汁么ゴ魚]というテキストが丸々削除され、その後ろから投稿されたってのは、まぁバグってるんだけどむしろいつもそうしてくれるならそうして欲しい。英字を含まないタイトルでもどうなるか、今後テストが必要だ。その他の送信先にはこちらの意図通りJISのメールが送られた。という事はいつかタイトルにわざとユニコードを入れたとき、それが化けずに連携できるかはわからないって事だな。

2055 letters | 1544 views | コメントする

 WordPressの新規投稿で待ち時間がやたらあるので、タイムアウトとかでバグるんじゃないかとヒヤヒヤする。いろんなサイトに更新通知を送ってたらそりゃ投稿に時間がかかって当たり前だが、果たして本当に遅いのは更新通知のせいかって事に疑問を持った。たまに短い文章で投稿テストするとあっという間に完了するのに、長文をポストするとそれだけ時間がかかる。連携通知は長文だろうが短文だろうが、本文を送ってないんだからかかる時間は同じなわけで、待たされる理由は他にあるんだなとわかった。投稿と言っても、昔のムーバブルタイプとかと違って静的ページを生成してるわけじゃなく、ただデータベースに送信してるだけだから普通は一瞬で終わるはずだ。データベースの書き込みが終わった後に、自分で追加したプラグインのどれかが何か仕事をしていて、それは本文の長さに影響される物であると言うことまでは推定される。今のところ、本文の長さに影響を受けるプラグインと言ったら一つしかなくて、おそらくSimilar Postsの仕業だ。

 Similar Postsは大変優秀で、何年かぶりにエイプリルフールの話題を書いたら、その何年か前のエイプリルフールの記事を探し出して勝手にリンクを貼ってくれた。本文に含まれている単語とかをチェックして、関連する投稿を何件も探し出すんだから、そりゃよほど大量の処理をしてるに違いない。でも、関連する投稿の表示数を何件にしても、または検索範囲を変えてみたとしても表示速度は変わらない。つまり、読み出しの時は検索してないか、検索のキャッシュみたいな物を使って高速化している。その高速化を行うために、投稿時に本文をチェックしていて、短文ならすぐ終わるが、長文なら時間がかかるって事だろうな。それって、もうちょっと検索精度を落としても良いから高速化できないのかしら?

 って事でオプションの設定を見回して、怪しいのはbatch sizeという項目だ。サーバーに負荷がかかるから、問題があるときは小さくしろって書いてある。じゃあ逆に問題がなくて大きくすれば何かメリットはあるわけ?メリットがないなら小さいほど良いわけで、問題がなくても小さくしてサーバーの負荷を抑えれば良い。一体この項目はなんなの?って事でググったけど解決しなかった。どこを見ても、サーバーの負荷を抑えるために小さくすることだけ書いてて、小さくしたら負荷を抑える代わりに何があるか、大きくしたらどうなるかには触れられていない。つーか誰もわからないんだけどさ。たぶんソース見ればわかる人はわかるんだろうけど、あたしにはサーバーのことまではわからないと思うんだ。ただ、サーバーと言えどもコンピューターなわけで、少ないメモリーでやりくりすれば遅くなるし、大容量メモリーを使って高速化することもあるはずなんだよ。まぁ、メモリーがボトルネックの場合のみだけど。だので、唯一可能性のある、Similar Postsを高速化しそうな手段は、やっぱりこのオプションの数字を大きくして見ることだと思うんだ。

 でもそれって、レンタルサーバーに対して迷惑な行為じゃないかって事も考えられる。考えられるけど、逆に、少ないメモリーを指定してCPUを長時間使わせるのと、多めのメモリーを指定してCPUを短時間しか使わないのと、どっちが良いかって事にもなるんじゃなかろうか。いや、もちろんこのオプションで高速化できるという前提での話であって、メモリーはたっぷり使うし高速化もせずCPUパワーも浪費するって可能性もあり、それだったら数字を大きくしても何も良い事はない。

[amazonjs asin="4822284611" locale="JP" title="検索エンジンはなぜ見つけるのか ―知っておきたいウェブ情報検索の基礎知識"]

 もう一つというか、むしろ逆かも知れないって予想もあって、数字を大きくするとパワーを浪費する代わりに検索精度が上がり、数字を小さくすると精度は落ちるが軽くなるって可能性はないんだろうか。例えば長文を投稿しても最初の何百文字しか類似性をチェックしないという設定があれば、メモリーも節約だし速くなるしで、あたしだったらそういう設定項目を作るけどな。それがbatch sizeってオプションだろうか?

 ソース読んでわかる自信がないなら、この数字を上げ下げしてしばらく投稿テストしてみれば良いんじゃね?自分の作ってる部分の投稿テストもまだ終わってないから、いろいろ兼ねつつ、どんどん長文をポストして比べてみるか?

追記:これをbatch sizeいきなり10倍の1000にして投稿し、1分半ぐらいかかった。Echofonが反応を始めたのが1分経過後くらいだから、そこから30秒は自分で書いた連携処理にかかってるんだろう。

2567 letters | 1414 views | コメントする

 何年か前、エイプリルフールが嫌いだって話を書いた。嘘をついてもいい日ではなく、面白い嘘をエンターテイメントとして発表する日だと。いざエイプリルフールだからって面白い嘘が考えつく人ってのは、エイプリルフールじゃなくても何かしら普段から人を楽しませてるに決まってるわけで、そうでもない人が無理にエイプリルフールだからって嘘を考えようとすると、誰も楽しくない嘘をついたり、人を傷つけたりするので、そういう人はエイプリルフールでは嘘をつく側に回るのではなく、他人の嘘に騙されて楽しむ側に回るべきだってのがあたしの見解だ。

 さてNHKがエイプリルフールだからって調子に乗って変な嘘をついて叱られたらしいが、これって本当に叱られるほどの嘘かなぁ。まぁ、「民放と合併」まではたぶん叱られるほどの話じゃない。その後の「国営放送」ってのも、民放の対になる言葉は国放でいいんじゃないの?合併したあとの方向性が民法路線ではなくNHK路線だって認識させる表現だ。と、ニュースの見出しとして、NHKの発言がここまでしか引用されていなかったので、このジョークの何が問題で、どういう人が非難してるんだかよくわからなかった。もう少し詳しく書いてある記事を読んでみると、そのあとに「着物を着た」云々ってのもあるんだけど、あたしはそれを読んでも全く北朝鮮を連想出来なくて、着物が特殊だとも思わなかったし、北朝鮮のオバチャンは絶叫気味なのではなく力強く芝居がかってるって思ってたから、そもそもNHKのジョークが北朝鮮のパロディであると言うことはあたしには伝わらなかった。合併だけは伝わったが、それ以外はただすべってるだけかと思った。例えば「鎧を着たアナウンサーが泣きながら性癖を語ります」とかと同等の意味のないことを言ってウケを狙ったとしか思わなかった。ホントにここまでだと、何が批判されてるのかわからないレベル。で、誰かがこれは北朝鮮をパロってると教えてくれたらようやく、あ、国営放送ってそういう意味か、あぁ、着物ってチマチョゴリとの対比ね、あー、あのオバチャンを絶叫気味って感じる人もいるのかぁって、やたら鈍い反応をしてしまった。あたしには伝わらなかったから叱られるほどのことじゃないが、伝わった人にとってこれって叱られるほどのこと?朝鮮をパロったぐらい別にというか、微塵もマズいとは思わないけどね。

 今ミサイルがどうのこうので騒いでるから、このタイミングだから不謹慎ってのはあるだろうね。今じゃなきゃ良いのかしら。拉致問題なり何なりあって、まだ北朝鮮を笑える情勢じゃないって思ってる人もいるだろうし。しかしそれにしたって北朝鮮のオバチャンをマネした芸人とかも過去にいくらでもいたわけで、あたしのような鈍い人には伝わらないほど遠回しにパロっても叱られるほどいけない事かな。まぁNHKだからダメってのもあるだろうね。芸人だと何でもかんでも笑いにするし、しょっちゅう叱られてるだろうし、そんなことはニュースにもならないが、NHKがやると叱られて削除したとかってニュースになるレベルなんだろうな。

 そこが言いたいんじゃない。あたしが言いたいのは、このニュースに対して別の番組で、NHKは冗談のセンスがないとか、他の所はもっと面白い冗談を言ってるとかって批判してた事が、それって後出しじゃないの?ってことだ。ディアゴスティーニをパクって120万円のエンジンがついてきて車を組み立てるという冗談なら面白い?人によると思うけど。白黒反転パンダの画像を捏造して面白い?人によると思うけど。これらが写真付でビジュアルな嘘だから、TwitterのテキストのみのNHKよりも明確に伝わって、想像力のない人を楽しませたかも知れない。NHKもビジュアルで朝鮮みたいなイメージを出してくれば、今回全然伝わらなかったあたしにも伝わったかも知れない。しかし、NHKがセンスないとか他がセンスあると言うことではなくて、非難されて削除したってニュースになって、面白くもない嘘だなぁとあとから言ってるだけじゃないのかと。車の嘘だってパロディだから本家から叱られるかも知れないし、自分で組み立てたら法律も絡むし、どこかから叱られる可能性がないわけじゃないし、パンダの嘘だって画像を捏造してるわけだから、紛らわしいと叱られる可能性がある。そういう所に対しも、叱られたら嘘が面白くないって言うんじゃないのかと。いやたしかにNHKは全然伝わらなかったし面白くもないよ。しかしよそと比べて劣るって話が出来るほどハッキリしたものかね。人それぞれでNHKや北朝鮮がツボの人もいるだろうし、センスを語る問題じゃないと思うがね。

[amazonjs asin="4004309476" locale="JP" title="NHK――問われる公共放送 (岩波新書)"]

 あたしには、NHKのセンスのなさが元凶のトラブルであるかのようにだけ伝わり、つまり面白くなさを批判されて削除されたかと思ってしまった。本当は、面白いかどうかじゃなく、北朝鮮をパロったからいけない(たぶん)って事があたしには全く伝わらなかった。NHKの冗談も伝わらなかったが、その冗談の何が悪いかも伝わらなかったので、詳しく書いてる記事を探すことになった。面白くない冗談ってのはたしかに困った物だけど、NHKの冗談はこれを面白いと思った人もいたかも知れないので、面白くないとかセンスがないとか言い切っちゃうほど低レベルとは思えない。その上で、何らかの理由でお叱りを受けたかも知れないが、叱られる理由もあたしにとっては考えなきゃ出てこないほど些細なことなので、今回ばかりは、面白くない冗談を言ったNHKだが擁護したい。でも、Twitterだからダメだったというのは確実にあるわけで、やるんなら想像力のないアホでも笑えるように、捏造写真を作ってインパクトのある嘘を用意しておけば良かった。うん、その写真を用意した時点でヤバい嘘ならヤバいって自分で気がつくしな。テキストだと自分でもやばいかどうか気がつかないんだろう。