検索結果

キーワード: ‘url’

予想通り、またGoogleのキャッシュが1割ほど減った。 現在、日本語のページ103件、ウェブ全体183件だ。 結局の所、キャッシュのあるページは増えたり減ったりしながら100件ぐらいで安定。 12月はたくさん記事を書いたので、キャッシュを消されたインデックスも多い。 新しい記事が追加され、古い記事はURLのみになり、いずれはインデックスもなくなる。 書けば書くほど消えていくシステムなので、くだらないことは書かない方が良い。 ブログ全盛…続きを読む

「浅田真央」でググって来てるログがあったので調べてみると、 12月に書いた記事の一部がGoogleに拾われていた。 その分、過去の記事がまたURLのみになったり消えたりして、 インデックスされている記事数の合計はほとんど変わっていない。 現在は日本語110件、全体173件だ。 入れ替えって感じだな。 インデックスされている中で、12月23日の記事が一番新しいな。 先月もこのころに入れ替えがあって、書いた次の日にインデックスされた記事があ…続きを読む

「補足結果」でググって来てる人がいたので、実際にググってみたら、 補足結果について明確な答えが出ていることを知る。 http://www.sem-r.com/3/20050605145043.html 説明されていることと、試してわかったことに矛盾はないと思った。 記事:補足結果 記事:補足結果#2 名づけ直すなら、1がフレッシュクロール、2がメインクロール、3が補足クロール。 ただ気になるのは、メインクロールを規制しているという内容。…続きを読む

Googleサイトマップの経過に進展があった。 この話をするために、Googleがサーバーにアクセスする二つUAを区別しておく。 Googlebot/2.1 (+http://www.google.com/bot.html) Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html) 前者を本物、後者を偽物と呼んでみる。 理由は、本物にクロールされない…続きを読む

実験したりもして煩雑になったのでまとめ直し。 ぜひ送信すべきところ http://ping.bloggers.jp/rpc/ http://blog.goo.ne.jp/XMLRPC http://bulkfeeds.net/rpc http://ping.speenee.com/xmlrpc http://rpc.technorati.jp/rpc/ping http://www.accelanavi.com/anavi/ping.p…続きを読む

自分がやらないことだと、他の人もやらないだろうと思ってしまうし、 どんな人がそれをしているのか全く想像もつかないが、ブログ検索って何に使うの? 他人の日記をからキーワードを検出し、新着順に並べるだけの検索を何に使うの? まさか、他人の日記が読みたくて、興味のある単語で調べたりするのかな? 先日姉歯の事を書いた記事にblog.with2.netから、投稿後1時間で30人リファラついたが、 その後はこの検索から一切来てなくて、今日フィギュア…続きを読む

なぜ、10月の記事がURL表示になっていたのか、なぜ日付ページがURL表示なのか、 今のところ仮説でしかないが、説明できそうだ。 それは、11月に行った”最近のエントリー”削除にヒントがあると思われる。 rNoteとAdSense サイトの中で一番ページランクが高いのは入り口な訳で、 Googleサイドが、このページランクを信用するなとアナウンスしたとしても、 Googleがサイトの中で一番重要と判断するページが入り口であることは変らな…続きを読む

Googleの検索結果って、こんなにも日々変動するものだったっけ。 最初に本命サイトの検索順位を追いかけ始めた頃は、一ヶ月に一回の更新を待ったのに。 ともかく、Googleサイトマップ内の情報が変ったと同時に、検索結果もかわった。 10月のどの記事6件がURLのみの表示になっているか書いておけばよかったな。 現在、URL表示なのは日付のページがほとんどで、個別記事は一つもなくなった。 その10月の記事が、ちゃんとキャッシュになったのか、…続きを読む

上位の検索クエリが20件表示されるようになってるな。以前は5件だけだった。 耐震偽装関係が多い。 それとは別に、”URL にアクセスできません”エラーが3件出ている。 http://wantech.ikuto.com/diary/01site/2005/1021_1059.htm http://wantech.ikuto.com/diary/01site/2005/1122_1547.htm http://wantech.ikuto.c…続きを読む

Googleでsite:wantech.ikuto.comを検索すると、日本語のページを検索で130件なのだが、 ウェブ全体から検索だと178件になっている。 別に日本語以外で48ページ作ったわけではない。 これらのページは検索結果にURLしか表示されず、キャッシュを見ることが出来ない。 おそらくGoogleが日本語のページだと判断するためには、 キャッシュに日本語が含まれていることが必要という事で間違いない。 だからキャッシュがなくて…続きを読む

先日、rNoteの再構築時にGoogleサイトマップも作らせるってのをやった。 して、サイトマップを登録してしばらく様子を見てみたが、 調査だけされて全然インデックスされてないので見せ損だっていう状況。 どうして調査だけされたって言ってるのかというと、来たGooglebotの種類が違うから。 でも、ひょっとしたらサイトマップ登録と無関係に回ってきたロボットかも知れないし、 ちゃんとサイトマップを理解して、そこに書いてあると言う理由で巡回…続きを読む

Yomiでミラーサイト作って実験してるのはあくまでGoogleに対してであり、 Yahoo!でどう拾われようが実はどうでもいいことなのだが、 このYomiミラーは、URLを静的表示にするためいろいろ細工しているのだが、 Yahoo!が、インデックス時にスラッシュを付けたり取ったり勝手にする物だから、 実際にスラッシュつくかつかないかで別の結果を返しちゃうので破綻している。 rNoteと同じように、.htaccessで強引にスラッシュ足し…続きを読む

Google向けにサイトマップを作ったとしても、拾ってもらえるという保証はないし、 実際、以前やったときはそのサイトマップだけに何回もアクセスがあり、 そこに書いておいたページは一切無視された経緯があるわけで、 まだこのサイトマップというサービス自体がベータということもあり、 これを作成することが徒労になることは十分あるわけだが、一応やってみた。 例によって今回も、どこをいじったかわからなくなるから自分用改造メモ。 まず、作るべきサイト…続きを読む

rNoteはオフで記事書いてFTPで上げるのが基本なので、 更新したときにブログ検索に情報を送る場合はサードパーティ製ツールを使う事になる。 http://www.nono150.com/ これを使えば、記事を書いて再構築して、そのまま管理画面から更新PINGを送れる。 だが、ずらっと並ぶ送信先の全てが軽いサーバーというわけでもないようで、 中には送信して反応があるまで数十秒とかかかる鯖もあるわけで、 それらの送信先全ての反応を丁寧に待…続きを読む

1674 letters | 666 views | コメントする

Yahoo!検索のキャッシュをチェックしていると、既に存在しないページが目立つ。 存在しないページであっても、.htaccessによってrNoteに引数を渡しているため、 本来はサーバーが404の応答をすべきところで、rNoteが200を返しているのだ。 rNoteは仕様上、記事のカテゴリを変更するとURLも変わってしまうので、 その際ただ404にするのではなく、似たエントリを発見したとかいって誘導してくれる。 コレはとても賢い機能で、…続きを読む