過去ログの改行を一括置換

1371 letters | 1394 views | コメントする

 rNoteを使ってたときは真魚にテキストで文章を書き、rNotePadにコピペして投稿していた。だからたぶんrNotePadが自動的にbrタグを入れてくれていた。投稿後に修正しようとするとソース表示しかなかったので、追記とかしたときは自分でタグを入れてた。そのrNoteの投稿を全部WordPressに持ってきたので、データベースに入ってる生の投稿データはrNote式の改行になってるわけだ。すなわち、一回の投稿につきpタグが一回だけで、その中で行われる改行は全てbrってわけだ。段落の区切りはbr二つだ。

 WordPressでは、ページを表示する際、データベースの生データにおせっかいな更正を施して出力する。そこ更正を止めるプラグインとかも存在する。例えば…と三点リーダの問題や、""とか''とかを全角に変更するとか、結構いろいろやってるみたいだが、改行についても、brが二つ続いてるところは自動でpにしている。うん、たしかにあたしのrNoteでの投稿でbrが連続しているところは、本来はpを入れるべき所なのにテキストエディタで文章を書いてたせいで面倒くさがって入れなかったところだ。だからその更正は正しい。その正しい更正について、データベースからデータを取り出す度に自動でやらせるのではなく、生データ自体を正規表現で一括置換してやった。いや、本当に一括だと8000件とかヒットしてメモリー不足で置換出来ないみたいで、一行目でいきなりマッチした場合、二行目でマッチした場合、三行目でマッチした場合、、、と次々に小分けにしてマッチさせていき、たしか5000件ぐらいだったら一括で行けた。2000件のデータを移動したが、段落は5個ぐらいが平均か?

 この別にやらなくてもいいことをやったのは、例えば1段落目と2段落目の間に広告を入れるとか、RSSとかの抜粋表示に最初の段落を使うとか、何か色々使えそうな場面がでてきそうだから、今のうちにやっておいた。広告と言えばAdMaxを試しているところだが、アダルト、ギャンブル、出会い系をオンにするとかなりあたしの興味をそそる広告が出るようになった。しかしその頻度は低く、楽天広告の頻度がかなり高いんだけど楽天が最もクリックしたくないような、ただの商品紹介で、しかも枠を分割して小さく数件出すから目立たない。楽天を表示させないオプションを探したが、そういうのにはまだ対応してないらしい。同じ人に同じ広告を出すとクリック率が下がるから、そうならないように自動的に変更するってサイトに書いてあったからこそ、むしろその部分を一番重要視して申し込んだのに、楽天ばっかり出してクソつまらん。ときどき出る「ペニス」とか「100万円」とかでっかく書いた広告が好きなんだけどな。かたや嫁のサイトは女が見てるってことを察知してダイエット関連ばっかりだから、一応サイト内容で変化するようだ。何を書いてるせいで楽天なんだろうな。どうやったらペニスが出るんだろう。

たぶん関連のある記事:

コメントは終了しています。