Googleからガイドライン違反でペナルティを受けたと推定されるサイトについて、米GoogleスパムチームのMatt Cutts(マット・カッツ)氏が問題点についてコメントしている。
同氏は問題点を2つ指摘している。第1に、検索キーワードに対応する主たるコンテンツが存在しないページがランディングページとなること、あるいは「検索結果の先が検索結果」であるランディングページは検索ユーザーが望んでいないことを挙げる。
第2に、ユニークな情報を持たず、単に他のサイトやデータベースからかき集めただけの情報で構成されたアグリゲーションページ及び自動生成ページを、誰が望んでアクセスするのかと疑問を呈している。
このコメントでMatt Cutts氏は直接的な表現は避けているが、上記2点はいずれもGoogleが望まないコンテンツやページであり、検索ランキングが下がってしまっても致し方ないケースといえよう。
So my advice to you would be to step back and ask yourself, "What separates explore.to from the thousands of other sites that just grab or license data from Acxiom or other yellow page data providers? Why would anyone searching on Google want to land on my pages instead of other the tens of thousands of other yellow page sites on the web?" Then concentrate on really pushing on the areas where you can add value for users. [Matt_Cutts, Google, Hit by a Google -50 penalty]
APIやRSSフィードなどを通じて他サイトから情報を寄せ集めただけの自動生成ページはいまだ日本でも一部のスパマーに利用されているが、最近はアルゴリズムによって自動的に検索結果から排除されつつある。たとえば一部の業者が行っていた、中古ドメインと飲食店サイト「ぐるなび」のデータを組み合わせて大量生成されていたサイト群はすでにGoogleから軒並み検索結果から排除されている。
同様に、Amazon.co.jp などECサイトからAPIを通じて取得した情報だけで構成されていた価格比較サイトも、検索結果に再掲載することが困難になっている。
もっとも上記1点目にあげた、「検索キーワードに対応するコンテンツが存在しない、ゼロサーチ結果がランディングページ」になってしまう問題は、日米問わずまだ解消されていない問題だ。これはGoogleがドメインやサイト全体のオーソリティのスコアリングによりある程度ページの重要性を評価してしまうことと、ページ上の少なくとも一部に該当キーワードが含まれてしまうこと(たとえば関連商品や売上ランキングなどの枠内にたまたま当該商品の文字列が表示されている場合)により発生してしまう。