URLの最後が
「.php」の場合と、
「.cgi」の場合と、
「.html」の場合と、
「.htm」の場合で、
ヤフーやグーグルの検索エンジンで上位表示されやすい・されにくい、といった違いはあるのでしょうか?
URLに「?」などが入っていると、動的ページとなって、上位表示されにくいという話は聞いたことがあるのですが(そのために、例えば、アマゾンのホームページはわざわざURLを静的な形となるように表示していると聞いたことがあります)、
そう考えると、URLの最後が「.php」や「.cgi」となっている場合には、「?」などが入っていなくても動的ページと看做されて、検索エンジンで上位表示されにくいのではないか?という疑問を持ってしまいました。
どなたか詳しい方、その辺の真相を教えていただけないでしょうか?
検索エンジンの表示順を決定するアルゴリズムは、かなりの頻度で変更されるようですので、今後どうなるかは分かりませんが、今のところ拡張子の違いによる表示順は大差がなくなってきたように思います。
「?」や「=」を含むURLは今でもクロールされにくい傾向にあると思います。
ご回答、ありがとうございます。
大差はなくなってきているのですか。
「?」や「=」は、やはり入れないような仕様で作った方が良さそうですね。
http://www.operationcheck.com/
SEOに重要なのはファイルの拡張子です。
最近のクローラはでも収集しますが、.phpや.cgiなどとなっていると価値が低く評価されるようなので、拡張子なしか、.htmlでPHPが起動するようにすると良いと思います。
ご回答、ありがとうございます。
やはり、.phpや.cgiは、まだまだ検索エンジン的には、低く評価されてしまうのですか。
もちろん、その辺の検索エンジンのアルゴリズムはブラックボックスなのでしょうが、やはり低い評価なのでしょうかね。
ヤフーの検索のシステムはあまり解明されていないので分かりませんが、グーグルは解明されてきているので紹介します。
上記のサイトの引用です。
ページの拡張子を【.html】とする。もしくは拡張子を隠す。
クエリー(?key=value...)ではなく、PATH INFO(PATH_INFO)を使って動的ページを作成する 。
結論
動的サイトは確かに検索されにくいが対処法がある。
ご回答、ありがとうございます。
そうなのですか。情報ありがとうございます。
もう少しご意見を募りたいと思います。
これだ!というご意見がある方、お待ちしております。
http://cgi.bookstudio.com/path_info/path_info.htm
こちらに実際にURLを静的に置き換えて実験したときの結果があります。
このURLの情報然りURLを静的なものに置き換えることでクロールされやすくなることはgoogleのガイドライン
http://www.google.co.jp/support/webmasters/bin/answer.py?answer=...
にもある通りなので正解だと思います。
また、動的なURLで値を渡す際には、こちらのガイドライン
http://www.google.co.jp/support/webmasters/bin/answer.py?answer=...
にある通り、「パラメータを短くしたり、数を少なくする」必要があると思います。
拡張子については、こちら
http://www.google.co.jp/support/webmasters/bin/answer.py?answer=...
に記載されていますが、今ではこれだけの拡張子がクロールの対象となっているので、この中にあれば有利不利というのは無いのではないでしょうか。
最近は、GoogleSitemaps
https://www.google.com/webmasters/sitemaps/login
というサービスによって、クロールの対象としたいページのURLを登録できるようになったので、ここに登録することでクロールされないという問題は解決できると思います。
クロールされやすいURLが上位表示に有利というのは、
クローラーがページの更新内容を拾いやすい
↓
頻繁に更新(管理)されているということが認識される
↓
情報が劣化しにくいサイトとしてページの評価が上がる
ということですが、この評価よりも非リンクの量と質に対する評価の方が格段に高いということが最近のSEOコンテストなどで実証されているので、URLの良し悪しが上位表示に与える影響は少ないのではないでしょうか。
なるほど。確かに、おっしゃる通りかもしれません。これだけ根拠付けられるご意見をいただけるとは思っていなかったので、とても嬉しいです。
貴重なご回答をありがとうございました。
とても参考になりました。
自サイトの経験ですが、やはり動的ページ(php)だと、googleのボットがリンクをすべて辿りません。2、3のわずかなページをもっていくだけで、大半のページはいつまでもスキャンされずに残ります。しょうがないので静的ページに見せ掛けるように変更したところ(.htaccessの機能で)、ちゃんとすべてをスクロールしてくれるようになりました。だから原則はそうだと思います。
しかし、有名なページの場合、私が使っているのと同じphp形式であっても、すべてインデックス化されているので、人気上位のページについては、phpでも全部スキャンするのだと思います。
なるほど。被リンク数が多い場合、スクロールされる機会も多いみたいなことは聞いたことがあります。
しかし、原則は、やはり静的な形にすべきなのかもしれませんね。
とても参考になりました。
mod_rewriteで検索すれば、参考になるサイトがいくつか出てくると思います。PHPのアプリを使ったSEOはmod_rewriteを使っています。
mod_rewriteは聞いたことがあります。確か、.htaccessを使って、動的ページのURLを静的ページっぽくする技術でしたよね(間違っていたら、ぜひ指摘してください)。
勉強してみます。教えていただき、ありがとうございました。
ご回答、ありがとうございます。
インデックスされても、その検索順位はやはり気になります。どうなのでしょう?