先日の最新ではないSEOに関連して、今度は、もう古いSEOの話。はてなに投稿された質問について。SEOについて考えて見ましょう。
SEO対策について質問です。SEOをやっている人などから以下の項目のようなことを聞くのですが、ソース(出所)を見たことがありません。以下のどれかについて可能な限り信頼できるソースか、または納得できる根拠をお教えいただけますでしょうか。
●.htaccessでURLを書き換えた(スラッシュ終わりなどにした)方がいい
●拡張子はphp(動的なもの)などよりhtml(htm)の方がいい
●ドメインは「wwwあり」の方がいい
●サブドメインよりディレクトリ分けの方がいい
●h1を入れるならbody直下が一番いい
●クローラーが重視するのはヘッダ(ソースの上部)だが、その次に重要なのは真ん中(コンテンツ部分)よりフッタ(ソース下部)
●文字コードはShift-JISが最も良い
●ディレクトリは浅い方が良く、ホームディレクトリに全htmlを置くのが最強
出典:はてな
1点目。検索エンジンのクローラビリティ(アクセシビリティ)を高める為の手段として、動的URLを静的URLに書き換え(リライト)した方が良いのは、今日のSEOのベストプラクティスの1つです。Googleは、クローラの性能が向上して動的URLでも問題がないという説明もしていますが、たとえばサイトリニューアルや新規サイトを構築する場合はシステム要件の1つとして静的URLへの書き換えは検討してよいでしょう。実際のインデックス状況を見ると、動的URLでは不具合が発生している事例が確認されているためです。
.htaccessでURLを書き換えた(スラッシュ終わりなどにした)方がいい
.htaccessでも httpd.conf でも良いのですが、書き換えるのは良しとして、URLの終わりはスラッシュの方がいいのか。これは、Google、Yahoo!、Bing など主要検索エンジン全てに対するクローラビリティを担保するなら、/ で終わったほうがベターです。これは、/ ありと / なしを別URLとして認識する検索エンジン(例えばYahoo!JAPANやBing)が存在するためです。
2点目。
拡張子はphp(動的なもの)などよりhtml(htm)の方がいい
2000年時点では、aspやphp、cgiではなく html (htm)の方がインデックスされやすかったのは経験的にも、当時の常識的にも事実。.do はインデックスされませんでした。しかし2010年の今日は、拡張子の違いは関係ありません。
ソースとしては、過去に開催された、SMSやSESなどのサーチ系カンファレンスや、Google Matt Cutts氏が同氏のブログやWebmasterWorld、動画などで説明したことがあると思います。「動的URLも静的URLと同様に扱う」 - Google Matt Cutts氏」も参照のこと。
3点目
ドメインは「wwwあり」の方がいい
wwwはあってもなくても同じです。www があるほうがサイト(ページ)の価値が高いという根拠になりうるならともかく、そうはなりません。つまり、レリバンシーを判断する上でもシグナルにはならないので、wwwあり・なしどちらでもOK。
ただし、リンクの評価分散を避けるために、いずれか一方に統一した方が良いです。たとえば、wwwあり と決定したら、wwwなしでアクセスされた場合に www ありに301リダイレクトされるように.htaccessなどで設定しておくと良いでしょう。
ソースは、Matt Cuttsが動画で話したことがあると思いますが、ネットで調べると リンク評価分散リスクの話はたくさんあると思います。
4点目
サブドメインよりディレクトリ分けの方がいい
これはウェブマーケティングの方針やサイト運用上の観点から判断すべきもの、合理的なものなので割愛。
以前はグループサイト間リンクを主な理由としてサブドメインが推奨されましたが、今日ではそれほど意味がなくなっていますし、少なくとも最近のYahoo!JAPANではトラブルの元になる場合があります。
5点目
h1を入れるならbody直下が一番いい
2000年時点では、大事なキーワードはソースコードの上部に位置した方がいいという理由でそれは真実でしたが、少なくとも2010年の今日において、GoogleとBingは関係ありません。
6点目
クローラーが重視するのはヘッダ(ソースの上部)だが、その次に重要なのは真ん中(コンテンツ部分)よりフッタ(ソース下部)
上に同じ。2000年時点では真実だったと思いますが、今はそうではありません。検索エンジンのコンテンツ解析技術は進歩しています。ソースは、インターネット検索技術の分野の書籍を参考にしてください。
7点目
文字コードはShift-JISが最も良い
関係ありません。ソースは不明。しかし、文字コードによってページの関連性評価を変更すべき合理的理由がありません。
8点目
ディレクトリは浅い方が良く、ホームディレクトリに全htmlを置くのが最強
2000年時点では真実。今は関係ありません。ディレクトリの浅さは、2010年現在は関係なし。ホームディレクトリに~の話は、順位が上がるかどうかの問題ではなく、クローラビリティの話だと思います。
全体的に、もう古い・使えないSEOです。質問に「どれかについて可能な限り信頼できるソースか、または納得できる根拠をお教えいただけますでしょうか。」と入っていますが、いずれも自分で実験すればわかると思いますので、是非、自分で試してみましょう。
【追記】
PHPを利用しているコンテンツは動的生成であり(動的コンテンツ以外で利用する可能性が低い)、ユーザー毎に異なるコンテンツを表示します。ユーザー毎に異なるコンテンツである以上、それが動的ページとして解析される分には問題ありませんが、それを静的コンテンツと偽ることでクローキングと見なされることになります。
動的コンテンツを静的に見せること、あるいはその逆など、サーバ内でどう処理されているかという話はクローキングと全く関係ありません。サーバのレスポンスでクローラ(人)が受け取る、コンテンツが焦点になります。
クローキングとは、ユーザに見せるコンテンツと、クローラに見せるコンテンツが全く違うものにする、その手法を指します。たとえば、ユーザにはきれいなFull Fashのコンテンツを見せる一方で、クローラには(Flashコンテンツには記載されていない言葉を含めて)文章中心の、検索エンジンが好みそうなコンテンツを表示するようなことを指します。
ユーザのIPアドレスやキーワードリファラ、ブラウザの言語設定を参照して表示する内容が切り替わるケースでも、クローラも同条件で扱われるのであればクローキングにはなりません。
cf.