米Googleウェブスパム対策チームのMatt Cutts氏は2013年5月15日、検索結果に表示されるドメインの多様性に関する変更を実施することを発表した。この変更内容はすでにチームミーティングで承認されており、近日中に導入される見込みだ。
先日のビデオで言及されていた、検索結果あたりの表示ドメイン数に関する変更がまもなく行われる。今後、同ドメインのページがGoogle検索結果に表示される件数が減少する。具体的には、あるクエリに対する検索結果nページにおいて、同ドメインのページが通算4件表示されると、以後の検索結果ページ(nページ以降)にはそのドメインのページが表示されないようになる。たとえば、あるクエリ(q)で検索した時に、www.example.com ドメインのページが、検索結果1ページ目で2件、3ページ目で1件、4ページ目で1件表示されると上限の4件に達するため、5ページ目以降でwww.example.comドメインのページは表示されなくなる。検索利用者は、同じドメインのページを何度も目にすることがなくなり、より幅広いサイトからの検索クエリにマッチした情報を参照できるようになる。
カッツ氏はビデオの中で、検索結果の多様性についての歴史について言及した。【制限なしの時代】同社はGoogle立ち上げ当初、検索結果あたりの同一ドメインからのページ表示数について特に制限は設けておらず、純粋に関連性のスコアリングに基づいて検索結果を表示していた。しかし、このアプローチは検索利用者の検索体験を大きく損ねるものとして変更されることとなった。検索クエリによっては検索結果のほぼ全てが同ドメイン上のページになってしまうこともあり、利用者の検索要求に対する選択肢を提示することが困難なためだ。
【クラスタリング導入期】そこでGoogleはホストクラスタリング(host clustering)を導入した。ホスト単位で分類を行い、検索結果に1ホストあたり最大2件の表示制限を設けることとした。この変更により、検索結果には関連性の高い、多様なサイトからの検索結果が表示されるようになった。
【ウェブスパムとの戦い】しかし一部の検索エンジンスパマーたちは、無数のサブドメインを展開し、検索結果を占拠する手法に乗り出してきたため、Google は更に変更を施し、検索結果ページをめくるにしたがって、段階的に同ドメインのページが表示されにくくなるような対策を実施した。多様性の観点から、ドメインあたり最大4程度に抑えることとした。この仕様はしばらく続けられたが、問題がないわけではなかった。たとえば、ある検索クエリに対し、あるドメイン上のサイトが非常に優れた、適合するコンテンツを公開していたとしても、先の「最大4ページ」の制約により検索利用者に情報を提示できないこともある。
【検索結果1ページ目の多様性】この課題を解消するために Googleは、ほんの数年前に、検索結果1ページ目は多様性を優先して多くのドメインからの情報を表示する一方、同2ページ目以降は関連性が高いと判断すれば同ドメインのページであっても検索結果に表示することとした。「多様性」と「優れたコンテンツの提供」のバランスをとったわけだ。
【1ドメインあたり4件目以降の表示に制限を】今回加える変更は、検索利用者からのフィードバックを踏まえたもので、検索結果ページを1ページ目、2ページ目・・・と辿って行くにあたり、同ドメインからのページが4件表示されたらそれ以後のページには表示しないようになる(されにくくなる)。たとえばSEOの神様のサイトを例にとると、クエリ「神様」で検索した時に webweb.jp ドメインのページが検索結果1ページ目に2件ヒット、同2ページ目に同じく2件ヒットしたら通算4件になるため、検索結果3ページ目以降は表示されにくくなる。
Why does Google show multiple results from the same domain?
Yeah, that's always a problem. One way we try to counter that is diversity. We haven't figured out any way to get around majority rules, so we want to show the most popular result first, but then after that, for the second one, you don't want something that's almost the same as the first. You prefer some diversity, so there's where minority views start coming in. [Peter Norvig, he director of research at Google, Error Message: Google Research Director Peter Norvig on Being Wrong, Slate, Aug. 3, 2010]
#
[UPDATE] 質問がありましたのでちょっと補足を。上記記事では4件と書きましたが、Matt Cutts の説明を聞く限り、明確な数が決まっているわけではありません。同ドメインのページが"数件" 表示されると次第に表示されにくくなることから、少なくとも「現状よりも表示数は減る」ことは確実な模様です。
本記事は書いてみたところ意外と日本語表現及び説明が難しく、便宜上4件とさせて頂きました。「いまより少なくなる」という趣旨をご理解頂ければ幸いです。(2013/05/20)
#
検索結果の多様性維持と、クエリに適合する権威あるサイト/コンテンツを表示することのバランスを考えた結果とのことです。楽天市場みたいなところはどうなっちゃうのかな。
[UPDATE] これも補足。影響を受けるサイトとは、あるキーワードに対して関連性が高いページが複数存在し、かつ個々のページの独立性が高い特性を持つサイト群です。たとえば、楽天市場やNAVERまとめは、複数の個人(企業)が個々にコンテンツをアップしていますが、他ユーザーに対して不干渉※ですから、結果として同ドメインに同キーワードに関連性が高いページが乱立することになります。
※ エンタープライズSEOにおけるベストプラクティスとして、たとえば企業内の部署間でキーワードの調整を行い、どこに誘導していくかを決定する。楽天市場やNAVERまとめのようなケースは互いが独立しているのでそういったユーザー間調整は当然のことながら行われない
Amazon.co.jp は、Amazonが用意した商品ページとは別個にショップが作成しているケースもあるので競合するケースは否定しませんが、楽天やNAVERのそれと比べれば影響は小さいと言えるでしょう。飲食店系は、プラットフォーマーのSEO施策の工夫とユーザー行動次第かと。不動産や飲食店を探す時は、それ系専門サイトに直接アクセスしてしまう人も少なくありません。どっちかというと、外部の検索エンジンよりもサイト内部の検索の方への探索依存性は高いのではないでしょうか。あるいは最近増加傾向にあるスマホ検索においては今回の変更はほぼ影響はないでしょうしね。
ブログやウェブサイトのホスティング系(各種無料ブログやfc2などのサービス)についての影響はよくわかりません。Matt Cutts はビデオの中で、こうしたサービス(あるいはサブドメインの扱い)について言及していませんので、これはふたを開けてみないとわかりません。(2013/05/20)