検索結果の入れ替え#2

日本語ページからの検索103件、ウェブ全体から検索192件。
実際にキャッシュがあるのは102件。
おとといクロールされたものが検索出来るようになり、
12月にキャッシュされたページを含むほぼ同量のページはURLのみになった。
表示上URLだけになった、という話ではなく、cache:URLでキャッシュ削除を確認した。
やっぱり、無駄なことを書けば書くほど、入れ替えで消されちゃう。
キャッシュされる必要のないページは、あらかじめ拒否させた方が良いかも。

ところでこのキャッシュが削除され、URLのみになったページは、
どのタイミングでURLさえも削除されるのだろうか?あるいはされないのか?
キャッシュのあるページの合計は入れ替えられて増えていかないけれども、
キャッシュのないページの合計は毎月増えている。
何より、既に日付別のページへのクロールは行われていないので、
それらがURL表示になったのはずっと前で、消えずにいる期間がずいぶん長い。
補足結果を検証したときのように、検索語句によっては出てくるように残ってるのかも。

もう一つ、Movable Typeをカスタマイズして遊ぶためだけに作られたmt.ikuto.comは、
まさに個人的に遊んだだけの場所なのでキャッシュされる必要もなく、
よそからはリンクを貰っていないわけだが、それでも20ページキャッシュされている。
現在はURLのみのインデックスはないが、きっとページ数を増やせば入れ替えは起こる。
汁ムゴ魚は約100件、そこは約20件、という上限が決められているのだろうな。
どうしてもキャッシュされたい重要なことを書く際は、
サブドメインを利用して別サイトにしてしまうのが一番の解決法のようだ。

例えば、サイトの入口を含む重要なページを普通にHTMLで記述し、
サイト内の一部コンテンツとしてブログや掲示板を設置した場合、
どうでもいい日記や連絡の書き込みのせいで、重要なページのキャッシュが消える。
そうしないためには、ブログや掲示板は別のサイトに置くとか、
どこぞの無料サービスで用意されたものを使うとか、あるいはロボットはじくべき。
勿論これは、Googleにキャッシュされることで訪問者数を増やそうとする場合だけね。
健全なサイトなら、Googleのためだけにサイト改造する必要は一切なし。

ブログ記事を知らない人に読ませても意味ないし、ロボットはじきは要検討。

1405053712
1405053712

たぶん関連のある記事:

コメントは終了しています。