アーカイブ
そのサイトマップの件もあって、久しぶりにオロカとイケドリを見てみたんだがね。 イケドリの方はなんか誰かの住所氏名書いてるなぁ。 オロカの方はスクリプト投稿でどっかのサイトの宣伝書き込みだ。 別にさ、管理しようとか秩序を保とうとか思わないので、それで構わないよ。 問題は文字化けね。 人間というか、ブラウザからの投稿なら問題ないのだが、 ブラウザからではなく、自動であちこち投稿するソフトとか利用されると、 こちらが受け付けたい文字コードとは…続きを読む
Yahoo!のニュースを見ていたら、Google Sitemapsに新機能追加だって。 で、スパムとかのサイトは検索から削除されるって前から言われてたけど、 その削除されたサイトのオーナーは通知を受けることができるんだってさ。 それ別にたいしたことじゃないんだけど、削除されたら「Google八分」って。 村八分から作った俗語みたいなのが、国際的にやってるGoogleに使って、 そんな言葉がYahoo!のニュースに当たり前に掲載されてるこ…続きを読む
先日から、Googleでsite:wantech.ikuto.comの結果がおかしな事になっている。 まだ不安定期っぽいので経過を正確にはメモっていないが、 まず、日本語ページからの検索で通常のキャッシュつきは約80ページほど、 8月のキャッシュが表示される「補足結果」が数十ページ、合計140ページぐらいになってた。 以前は、この検索方法では補足結果が表示されていなかったので、 補足こみでならインデックス増加、メインインデックス自体は減…続きを読む
いろいろ自由に出来るrNoteでも、自由にならないところはいろいろあるわけで、 その中でも、一番不自由で困るところはnavi_forthbackの部分だろうな。 記事:rNoteのパンくずリスト navi_forthbackをオプションなしで使った場合に表示されるのは、 上段はカテゴリ、下段は前後移動で、通常2行にわたるサイト内リンクだ。 今回の改造では、この上段の部分だけ表示、下段の部分だけ表示ってのをやった。 ただし、下段は全く不要…続きを読む
パンくずリストってのは、例えばこの記事は、 汁ムゴ魚/日記的なもの/サイト関連/2006 と言うカテゴリーに属するわけだが、この全ての親カテゴリへ移動するためのリンク。 何かの童話で、道に迷わないようにパンをちぎっておいていくっていう状態に由来。 rNoteでは、スキンにnavi_forthbackと書けばこのパンくずリストが出せる。 はずだった。 rNoteはサブカテゴリ、サブサブカテゴリ、と言う風に一応作れるけど、 あんまり深い階層…続きを読む
日本語ページからの検索103件、ウェブ全体から検索192件。 実際にキャッシュがあるのは102件。 おとといクロールされたものが検索出来るようになり、 12月にキャッシュされたページを含むほぼ同量のページはURLのみになった。 表示上URLだけになった、という話ではなく、cache:URLでキャッシュ削除を確認した。 やっぱり、無駄なことを書けば書くほど、入れ替えで消されちゃう。 キャッシュされる必要のないページは、あらかじめ拒否させた…続きを読む
昨日はGooglebotが83ページくらいリクエストした事がログからわかった。 今日、一番書いておきたいのは上記のたった一行だ。 先月の今頃は何ページくらいのクロールがあったか忘れたので、コレをメモしておく。 今回クロールされた83ページが、今後のインデックス総数かも知れないので。 後は全部おまけ。 おとといまでに書いた、まだGoogleに拾われていない1月分の記事がよく拾われていた。 かといって、別にGoogleが新しいページに敏感と…続きを読む
昔ながらの手作業で作るサイトだと、リンクというページがあったりする。 そのリンクっていうページに、相互リンクとか好きなサイトとかが載っている。 ブログなんかだと、サイドバーに友達のブログを貼っておいたりするから不要か。 珍々堂で昔、「相互リンクしてください」っていうメールにだまされて、 おかしなサイトにリンクしたことがあり、そのとき以来相互リンクは信用しないことに。 相互リンクしてくださいって言ってくる人も、リンクしましたって報告する人…続きを読む
予想通り、またGoogleのキャッシュが1割ほど減った。 現在、日本語のページ103件、ウェブ全体183件だ。 結局の所、キャッシュのあるページは増えたり減ったりしながら100件ぐらいで安定。 12月はたくさん記事を書いたので、キャッシュを消されたインデックスも多い。 新しい記事が追加され、古い記事はURLのみになり、いずれはインデックスもなくなる。 書けば書くほど消えていくシステムなので、くだらないことは書かない方が良い。 ブログ全盛…続きを読む
まだ12月が終わってないが。 嫁が新刊を出したにもかかわらず、嫁のブログからアマゾンでの購入者はたった一人。 どいつもこいつも書店で購入しているらしい。 著者本人のブログですら、その著書を売ることが出来ていないのに、 著者でもないのにアマゾンにリンク貼ってどれほど儲けることが出来るというのか。 嫁は先日、アマゾンで本を購入する方法がわからず、あきらめて書店に行った。 ひょっとしてさ、アマゾンはクリックされてから購入決定まで難しすぎるんじ…続きを読む
「浅田真央」でググって来てるログがあったので調べてみると、 12月に書いた記事の一部がGoogleに拾われていた。 その分、過去の記事がまたURLのみになったり消えたりして、 インデックスされている記事数の合計はほとんど変わっていない。 現在は日本語110件、全体173件だ。 入れ替えって感じだな。 インデックスされている中で、12月23日の記事が一番新しいな。 先月もこのころに入れ替えがあって、書いた次の日にインデックスされた記事があ…続きを読む
「補足結果」でググって来てる人がいたので、実際にググってみたら、 補足結果について明確な答えが出ていることを知る。 http://www.sem-r.com/3/20050605145043.html 説明されていることと、試してわかったことに矛盾はないと思った。 記事:補足結果 記事:補足結果#2 名づけ直すなら、1がフレッシュクロール、2がメインクロール、3が補足クロール。 ただ気になるのは、メインクロールを規制しているという内容。…続きを読む
ついにNAMAANに拾って貰えた。 拾って貰えてるよそのブログのRSSを比較して、dc:creatorというタグに気がついた。 rNoteは複数の投稿者を想定していないので、RSSの最初の方に一度しか出てこないが、 よそのブログでは各記事ごとに書かれているものもあり、一応パクって見た。 直接関係ないかも知れないし、そうでないブログも拾われている。 ”rNote”で検索すれば、rNote製ブログがたくさんヒットするはずなのだが、 数十日前…続きを読む
Googleサイトマップの経過に進展があった。 この話をするために、Googleがサーバーにアクセスする二つUAを区別しておく。 Googlebot/2.1 (+http://www.google.com/bot.html) Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html) 前者を本物、後者を偽物と呼んでみる。 理由は、本物にクロールされない…続きを読む
何これ? site:wantech.ikuto.comで検索して、時刻がついているのはこの一件のみ。 もしクロールした時間なら、この1ページだけクロールしたなんてあり得ないし、 いつものサイズの隣に出る日付が出ていない。 今日の1:33amだとすればつい30分くらいまえだ。 その時間に何が起こったんだ? いつもはアレじゃないかコレじゃないかと予想したりしてるんだが、もう眠いし無理。 追記 コレって自分で見た時間だったみたい。もう一度クリ…続きを読む