中~大規模サイトの運営・SEOの推進に携わっている方から時折相談を受けることがあるのですが、過去に記事化したことがなかったと思いますので改めて。2つの質問、『タギングで生成される多数ページを検索エンジンにインデックスさせていくことは SEO 的に有効な戦略なのか?』と『サイト内検索結果で出力される無数のページを検索エンジンにインデックスさせることは SEO の観点から効果的なのか?』は本質は同じですので両方を一緒に扱って説明をします。
要約:意味があるタギングページならインデックスさせればよい
先に結論を。かつて米Technoratiが駆使した、無意味なタグを大量生成して検索上位を占拠する手法は全く使えない(ガイドライン違反)のですが、今日でも意味がある分類ページならインデックスさせても問題ありません。効果は、ニッチなキーワードでの流入経路確保程度。
背景知識:巨大なサイトに見せかけることは 効果的な SEO だった
少なくとも2003年~2009年頃までは、(内容を問わず)巨大なサイトに見せかけること、すなわち、総ページ数が多いサイトであること自体が SEO に有利に働いていました。つまり、あるドメイン内にある総ページ数が 1000 のサイトXと 1000万のサイトYであれば、仮に他の全ての条件が同一であれば基本的に Y が有利に働くのはもちろん、仮に Y の方が品質的に劣っていたとしてもページ数が多い Y が比較的有利でした。
当時の Google は、サイトの規模を権威性(オーソリティ)を判断するシグナル(手がかり)の1つとして利用していましたので、単純にページ数が多いサイトは検索順位を上げやすい傾向にありました。当時、ページ数が多いサイトといえば情報多彩なポータルサイトが多かったからです。
※ 蛇足ですが、今日の Google は、品質が伴わないページ数が多いだけのサイトは権威性を認めませんし、また、どの領域・分野の権威性が高いのかを判断(Topical Authority)しようとします
後述するように2014年現在は「ページ数が多いだけで内容が空っぽなサイトは検索順位にネガティブな影響がある」ので意味がないのですが、少なくとも当時(03~09年頃)は有利だったという背景を頭の中に入れて、次をお読みください。
タギング(tagging) で SEO の効果を高める?
タギングは、ウェブページを整理・分類して検索しやすくするために、ページに関連する短い文字列(単語やフレーズ)をメタデータとして付与する手法のことです。例えば、バラの庭園を紹介したページには「バラ」「庭」といったタグを、クリスマスイルミネーションを紹介したページには「クリスマス」「イルミネーション」といったタグを設定しておきます。そして、来訪者が任意のタグをクリックすると、同じタグが付与されたページ一覧を参照できるといった具合です。
特に情報量が膨大でカテゴリによる分類では目当ての情報を探すことが困難なケースにおいて、内容にあわせて付与されたタグを手がかりに分類することは一定の有用性はあります。無論、タグの付与の方法に依存しますけれども。
タギングは特にWeb 2.0 (死語)という言葉が流行っていた時に、多くのメディアやブログで採用されていました。はてなブックマークや Flickr、ニコニコ動画などで採用されているタギングは主に閲覧者である第三者がコンテンツに付与するタグですが、CNET Japan や Engadget、TechCrunch のようにサイト運営者自身が記事1つ1つにタグを設定していることもあります。
さて、SEO に活用できるタギングは後者のサイト運営者が自身のコンテンツ1つ1つにタグを設定した場合です。例えば、100種類のタグを用意すれば、自動的に100種類の●●●タグがついた記事一覧ページが作成されることになります。10万のタグを作成すれば、10万の記事一覧ページが生まれ、「10万ページもあるサイト」が出来上がります。
同手法を用いてかつて数多くの検索キーワードで Google 検索上位を独占していた代表的なサイトがブログ検索メディア・ Technorati (テクノラティ)本家サイトです。当時の Technorati は収集したブログ記事それぞれにタグをつけ、そのタグに合致する一覧ページそのものを次々と Google に登録していました。最終的にいくつのタグを生成していたのか定かではありませんが、分類には全く役に立たない語句のタグも数多くありましたから、おそらく SEO の効果を狙ってタグの無限増殖を行っていたに違いありません。ともかく、その手法によって当時 Technorati は数多くの一般検索キーワードで Google の検索結果上位にほぼ必ず表示されていました。
サイト内検索結果ページの活用で SEO の効果を高める?
サイト内検索結果はその名の通り、サイト内のページを検索するために用意された検索機能です。ニュースサイトや不動産、飲食店、通販サイトではほぼ間違いなくサイト内検索が用意されていることでしょう。
私が知る限り、2000年の時点で「SEO を考慮に設計されたサイト内検索サービス」は米国にいくつか存在しました。日本でも2006~2010年頃には SEO 観点の要件を考慮したサイト内検索ASP がいくつか登場しましたね。要は、訪問者が入力したキーワードにあわせて動的に生成されるサイト内検索結果ページそのものを、Google がインデックスできるように URL を静的に出力するように設計されたものです。あるいは、検索結果ページそのものを静的ページとしてキャッシュして Google に登録させる仕様のものもありました。
(Googleに登録される)サイト内検索結果ページは、実際にユーザーが入力した検索キーワードのバリエーション総数により決定されます(キーワードの検索回数ではなく、キーワードの種類の総数)。例えば、過去に入力されたキーワードの種類の総数が10万であれば、10万のサイト内検索結果ページが Google に登録されることになります。ユーザーが検索時に使用するキーワードのバリエーションが増えれば増えるほど総インデックス済みページ数も増加し、巨大なサイトになっていくのです。
「Google検索結果をクリックした先が検索結果ページ」は検索利用者にとって有益といえるのか?
こうした「見せかけのページ数を増やすことで SEO を有利に進めるアプローチ」は、2010年前後を境に効果を失っていきます。
第1の理由は、『検索結果をクリックした先が検索結果である』ことは検索体験を大きく損なうものだからです。Google (ほか検索エンジン)は、検索利用者が入力したキーワードと適合性が高いリソース(=コンテンツ)へのリンクを提示することが検索会社の果たす使命と考えています。しかし、タギングされた記事一覧やサイト内検索結果ページは、いわば検索結果ページです。検索結果の先がまた検索結果では、検索者は一体何のために Google で検索したのかわからなくなります。
こうした状況を放置することは、検索品質の低下、ひいては利用者の離反を招きかねませんので Google も放置できません。そこで、検索アルゴリズムを改良し、価値のない検索結果ページ(=情報一覧ページ)はインデックスから排除する、検索結果の上位に表示されないように対処することになりました。
多数のコンテンツを保有するからといって、品質が伴うとは限らない
2010年前後から話題になった Demand Media に代表されるコンテンツファーム問題も、『ページ数が多いだけのサイトに本当に価値があるのか』という疑問を投げかけることになります。Demand Media は、情報量的には充実していながらも、人間が読んでもさっぱり役に立たない、品質に相当問題があるサイトでした。ところが検索トレンドを分析して人々が実際によく検索しているキーワードにフォーカスして、毎日数千もの記事をアップロードし続けたことで検索トラフィックを獲得することに成功しました。
しかし、内容的にたいして役に立たないページばかりが表示される検索結果を放置することもまた、検索品質の低下と利用者離れを招きかねませんから Google が対処することになりました。それがお馴染み「パンダアップデート」です。
パンダアップデートの導入以後、タギングページやサイト内検索結果ページで生成されている、ほとんど意味のない軸で生成された一覧ページを大量に抱えているサイトは、コンテンツ品質に問題があるサイトとしてガイドライン違反とみなされるようになりました。実際、無意味なタギングページやサイト内検索結果ページを大量に抱えていたために検索順位の大幅な低下や、Google から警告を受けた経験があるサイト運営者の方はいらっしゃるのではないでしょうか。
タギングページやサイト内検索結果ページの生成はすべきか?
2014年現在、タギングページやサイト内検索結果ページを Google に登録する行為は、SEO 的にメリットがある手法でしょうか。
まず第1に、ページ数を水増しする手法としては全く意味がない、とお断りをしたうえで、その(タグまたはキーワードによる)分類方法に意味がある(=ユーザーに価値がある)のであれば、そのまま利用して問題ありません。ユーザーに価値がある分類はすなわち、Google にとってもインデックスする価値があるからです。
しかし、水増しそれ自体を目的に無暗やたらと生成されたタギングページやサイト内検索結果ページは、削除するか noindex または robots.txt を使って該当ページが Google に掲載されないよう配慮することを強く推奨します。それらコンテンツをまとめて別のサブドメインに退避させて、そのサブドメイン全体を Google にクロールさせないよう設定することも有効です。ユーザーに価値がないページが無意味に生成されている場合、Google にコンテンツ品質に問題があると指摘される可能性が非常に高いです。ページの絶対数を増やすこと自体は SEO 的に意味がありませんので控えましょう。
まとめ:タギングやサイト内検索結果ページを Google に登録したい場合の注意点
- タギング:ユーザーに価値のある分類としてのタギングがされるのであれば(その一覧ページがコンテンツとして価値があるのであれば)、そのタギング一覧ページは Google に登録させても構わない。具体的には、その記事特有のタグを付与すること。
良い例:iPS細胞の記事に「分化万能性」や「自己複製能」など、その記事だからこそ出現する言葉をタグ文字列として使用する、「Yahoo!とMicrosoftの検索事業提携に関連する記事一覧」「東京都内の有料自習室一覧」など、一覧自体が有用そうなもの 悪い例:iPS細胞の記事に「中心」「大学」「細胞」など一般的な文字列をタグとして使用する、「私は」を含むタグ一覧、「笑える」タグ一覧ページなど、一覧化する意味が薄いもの - サイト内検索結果:原則として、Google に登録させる必要はない。ただし、サイトで標準提供しているナビゲーションでは目的の情報に到達することが困難で、その検索を補助する手段として特定語句を含むサイト内検索結果ページを提示する以外の方法がないのであれば、その結果ページを Google に登録しても問題はない。仮に、そうした対処法を行う必要がある語句が多数あるのであれば、そもそものナビゲーション機能の改修を検討した方が望ましいといえる
- サイトの総インデックス数:2014年現在の Google は、コンテンツの品質が伴わない、無意味なページばかりで占められているサイトは優れたサイトとは判断しない。ユーザーに価値がないに等しい一覧ページを大量に抱えているのであれば、削除してしまうか、クロールされないように設定することが望ましい
- Google はタギングやサイト内検索結果という機能自体を否定しているわけではないので、これらの機能をサイトから削除する必要は全くない。Google が問題にしていることは、これらの機能が生成するページを無暗やたらと Google に掲載させようとする行為である。
- 心配であるなら、ページ内のタギングのリンク先に全て nofollow をつけても構わない。
- 今日(2014年)におけるタギングページやサイト内検索結果ページをGoogleに掲載することのメリットは、その(タグされた)キーワードでの流入経路を確保できること
タギングやサイト内検索結果をナビゲーションの1つとして提供することは全く問題ありません。それらのページを無限増殖させて Google に掲載させようとする行為が NG です。Google は原則として「(Google)検索結果ページの移動先が(サイト内の)検索結果ページになっている」ことは好みませんが、それに意味があるならば、その一覧がコンテンツとして来訪者に価値あるものならば、インデックスされるようになっていても問題はありません。
タギングされた文字列、またはサイト内検索結果ページの軸となっている文字列での検索流入経路を確保することが主たる目的になりますので、超ロングテールなキーワードでの流入増を狙ったSEO施策という位置づけと考えるとよいでしょう。
#
昔の Technorati はすごかったですね。
cf.