引数なしのURL#2
なんか、もっと書きたくなったので続きを書いてみる。
引数付きのURLでは、そうでないURLとどう違うのかをもう少し詳しく。
ttp://example.com/hoge.php?a=1&b=2
ttp://example.com/hoge.php?b=2&a=1
上記二つのURLは、引数の値が同じで順番が違うという例だが、
この場合、スクリプト側は引数の値しか取得しないので、順番が違っても同じページを見せる。
ttp://example.com/hoge.php?a=
ttp://example.com/hoge.php
上記二つのURLも、スクリプト側から見たら同じ物なので同じページを見せる。
aに何も値を入れないという引数は、あろうがなかろうが、aに何も入れないので同じだ。
一つの全く同じ内容のページに対して、二つ以上のURLが存在した場合、
その両方を検索結果に出すというのは無駄であり、全然よろしくない。
よって、複数あっても代表してどれか一つしかインデックスしないのがスマートなやり方だが、
サイト運営者から見たら、全てのページがインデックスされないという点で、
引数付きのURLだと不利になるという発想に到達するはずだ。
実際は、同じページが複数インデックスされない方が平等であり、全く不利ではない。
同じ内容のページが複数検索結果に出るべきではないという発想は、
引数ばかりではなく、ミラーサイトやキャッシュサイトの一本化にもつながるだろうな。
だけど、完全なミラーサイトではなく、同一データベースの共有だけとかだと、
ミラーか類似かまでの判断が出来ないようで、いくらでも検索結果に出てくるけどな。
そういうわけで、同一ページの排除が行われているんだから、
引数付きのURLだけを選別してわざと検索結果に出さない等の処理をする必要はない。
以上、あくまで、「自分で検索エンジンを作るなら」サイトを引数なしにする必要がない理由だ。
そして逆に、引数付きじゃないページの方がよくインデックスされているという事実もある。
もちろん事実といったって、うちでやってるサイトだけの問題に過ぎないが。
やる必要がないかもしれないし、やっても損はないかも知れない程度の問題だし。
くだらないと言えばくだらないことで、やり方がある部分はやっておこうという程度の話。