まばらキャッシュ

以前はトップ以外は検索はじいてたせいで、トップ以外から訪問する人はいなかったが、
最近は日記の各ページに検索エンジンから辿り着く人もいるので、
全てのページが検索対象となるように、Googleのキャッシュに気を配っている。
トップから2クリックでいけるようにすれば、全ページがキャッシュされると予想したが、
そういう変更を行ってもやはり拾われるページはまばらだ。
3クリック以上しないと辿り着けないページも拾われている。
問題の9月の記事は18件中10件拾われたので、作戦はある程度効果あったようだ。
他の月の記事も、結構な割合で拾われているがやはり全部じゃない。
まるで、リンクを辿るかどうかの決定を乱数でやっているかのごとく、
まばらに拾われて、どんなページを拾っているか法則性が見いだせない状態だ。

これってもし、拾うページ数が多くなりすぎないよう制限してるとしたら、
何年か先まで日記とか書いてページ数が増えたとして、
古い記事はどんどんGoogleから見捨てられていくか、
さもなくば新しい記事を書いても拾ってもらえる確率が下がっていくか、
そのどっちだとしても問題あるよね。

例えばこのページのように、あまり人に読んで欲しいわけでもないような、
検証の途中経過の記事もあるけれど、作ったソフトを発表する記事の場合は、
書いてすぐキャッシュされて欲しいわけだし、古くなっても消えないで欲しいわけだ。
もし、こちらから重要ページを指定してキャッシュさせられるなら、
どうでも良いページは後回しにして、必要なページを優先させる作戦をとりたい。
もちろんどうでもいい方のページだって、後回しでも拾われたいし、
作戦があるなら優先方法ではなく全部取得方法にしたいわけだ。

以前、Googleが提案するサイトマップなんかをrNoteの再構築時に自動で作らせ、
全てのページを拾わせる作戦をやってみたのだが、そのサイトマップ自体だけ拾われ、
各ページは拾われないってことがあったので信用していないのだが、またやってみるか。

4061484524
4061484524

たぶん関連のある記事:

コメントは終了しています。