引数付きURLは不利っぽい

1743 letters | 452 views | コメントする

昨日はGooglebotが83ページくらいリクエストした事がログからわかった。
今日、一番書いておきたいのは上記のたった一行だ。
先月の今頃は何ページくらいのクロールがあったか忘れたので、コレをメモしておく。
今回クロールされた83ページが、今後のインデックス総数かも知れないので。
後は全部おまけ。

おとといまでに書いた、まだGoogleに拾われていない1月分の記事がよく拾われていた。
かといって、別にGoogleが新しいページに敏感というわけではなく、
テキストエディタ関連リンクは新しく作ったのに拾われてないし、
既にキャッシュされているページを複数回リクエストしてたりもしてる。
まぁ、狙い通りというか予想通りというか、トップページに「最近の記事」貼ってるし。
コレでまた、新しいページがキャッシュされ、同量の古いページのどれかは削除だな。
記事:消えゆくキャッシュ
記事:検索結果の入れ替え
記事:キャッシュのないインデックス#3

で、新しい記事を書くと、新しい日付別ページも出来る仕組みなわけだが、
その新しい日付ページには、GooglebotではなくMozillaでのみリクエストが来る。
Mozillaは広範なページをGooglebotに先駆けて取得していくのだが、
Googlebotの方に取得されないと、検索結果にページは出てこないのだ。
12月にサイトを改造し、日付別ページはGoogleに拾われにくくした成果はバッチリ。
そりゃいいんだけど、同様に引数付きページもMozillaだけが取得していく。
日付別や月別のページは、rNoteでは本来引数付きページだが、そこは改造してる。
汁ムゴ魚内で残っている引数付きページは、
各カテゴリを選んだときに10エントリーずつサマリーを表示する、?p=っていうヤツらだ。
汁ムゴ魚やってすぐは、引数がついても全然関係なく拾われていたのに何でだろうかと。
コレもおそらく、ページ数が増えたせいだと思う。
間引きの条件はいろいろあると思うが、その条件の一つとして引数付きは不利だろうな。

かといって、サイト全体を引数ナシで偽装するのは得策とは思えない。
必要なページほど引数なしで間引きを逃れ、不要なページほど引数使うのがベスト。
汁ムゴ魚の?p=は不要なページなので、間引かれて大いに結構。
その分、個別記事が残ってくれるので助かっているな。

4540042483
4540042483

たぶん関連のある記事:

コメントは終了しています。