アーカイブ

2005年 12月 24日 のアーカイブ

ついにNAMAANに拾って貰えた。
拾って貰えてるよそのブログのRSSを比較して、dc:creatorというタグに気がついた。
rNoteは複数の投稿者を想定していないので、RSSの最初の方に一度しか出てこないが、
よそのブログでは各記事ごとに書かれているものもあり、一応パクって見た。
直接関係ないかも知れないし、そうでないブログも拾われている。
”rNote”で検索すれば、rNote製ブログがたくさんヒットするはずなのだが、
数十日前までさかのぼってようやく、ある一カ所の記事が大量に拾われているのみ。
そこはRSSを改造してないようなので、さらに条件がわからない。
そのサイトの新しい記事も拾われていない。
汁ムゴ魚の記事も、今日やっと一つ拾われただけで、この先拾われないかもしれない。

ともかく、Ping通知先としては、そこの検索を使っている人がいるかどうか以前に、
更新通知を受け取って貰えるかどうかを見なければいけない。
さらに、受け取って貰えてもすぐ消えちゃう所もあるので吟味が必要。
その辺も考慮して、もう一度優先度順に並べ替え。

重要なのでぜひぜひ。
http://ping.bloggers.jp/rpc/
http://blog.goo.ne.jp/XMLRPC
http://blog.with2.net/ping.php/

ほぼ拾って貰えるのでぜひ。
http://rpc.technorati.jp/rpc/ping
http://www.accelanavi.com/anavi/ping.php
http://bulkfeeds.net/rpc
http://ping.speenee.com/xmlrpc
http://ping.blogoon.net/

拾ってくれるかも知れないのでついでに。
http://blogstyle.jp/xmlrpc/
http://ping.namaan.net/rpc/

リストアップのみで検索できない。
http://ping.blogmura.jp/rpc/
http://ping.cocolog-nifty.com/xmlrpc

確認できないとかよくわからないとか。
http://ping.myblog.jp/
http://www.blogpeople.net/servlet/weblogUpdates

拾って貰えない。
http://blogdb.jp/xmlrpc
http://www.31engine.com/weblogUpdates/1.cgi
http://blog-search.net/up.php

タイムアウトのデメリットも考えれば、ぜひぜひとぜひだけで大丈夫だろう。
ほかに、日本以外の通知先もあるが、国外に通知しても英語のTB来るだけでしょ。

記事:更新通知Pingはどこに送るべきか
記事:更新通知Pingはどこに送るべきか#2
記事:rNoteのRSS Feed

4820716484
4820716484

Googleサイトマップの経過に進展があった。
この話をするために、Googleがサーバーにアクセスする二つUAを区別しておく。
Googlebot/2.1 (+http://www.google.com/bot.html)
Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
前者を本物、後者を偽物と呼んでみる。
理由は、本物にクロールされないとインデクスされないから。
Googleサイトマップを作成すると、偽物でのアクセスが増えるが、
偽物でいくらアクセスされても検索結果に表示されることはない。

さて、汁ムゴ魚ではより多くの記事をGoogleの検索結果に表示させるために、
Googleサイトマップに個別記事ページを全部羅列させるように、rNoteを改造した。
羅列しているのは個別の記事で、月別や日別のページ、カテゴリは羅列してない。
記事:rNoteでGoogleサイトマップ
もし、Googleがサイトマップが有効ならば、
月別や日別のページより個別の記事にアクセスするはずだが、ログを取っても気配はなし。
いつも通り、トップからURLをたどったような順番で偽物クロールされている。
そこで、トップからURLをたどっても到達できない、404なページをサイトマップに追加。
記事:Googleサイトマップに細工
サイトマップ本体は毎日数回取得される物の、404ページへのアクセスはなく、
しばらく待って、昨日ようやくこの404ページに偽物クロールが訪れた。
ただし、その他のページと共に一斉にクロールとかはしないらしく、
サイトマップに書いてあるページは少しずつ日を改めながら見ていくらしい。
また、偽物クロールは来たが、本物クロールは来ていない。
これが、今回あったGoogleサイトマップの経過進展の全てだ。

欲しいのは本物のクロールであり、偽物のクロールでは意味がないし、
実際に、検索結果に表示される記事数は増えていない。むしろ徐々に減っている。
今回の偽物でのアクセスも、インデックスのためではなく調査のためかも知れない。
そこで、404でインデックスされないページではなく、実際に隠しページを作成し、
入口からいけないページがインデックスされるか試してみたい。
やり方は、これまでと同様にサイトマップにコッソリ追加して待つだけ。

この実験が成功すれば、それと同時に全記事インデックスも達成出来るはず。

B00016BAMK
B00016BAMK