SEMリサーチ

企業で働くウェブマスター向けに、インターネット検索やSEOの専門的な話題を扱います

Google Matt Cutts「ウェブ上のコンテンツの25-30%は重複コンテンツ」

米GoogleウェブスパムチームトップのMatt Cutts(マット・カッツ)氏は2013年12月16日、ウェブマスターから頻繁に質問が寄せられる重複コンテンツ(Duplicate Content)についての質問にビデオで回答した。

同氏はまず第1に、Googleは重複コンテンツを一律にウェブスパムと判断しているわけではないと説明。通常のサイト運営を行っていてもどこかのページで重複は必然的に発生するからだ。しかし、ある検索クエリに対して、(異なるURLながら)同一のコンテンツを持つページを検索結果に複数返すことは、検索結果の関連性や品質の観点から望ましいことではない。どのリンクをクリックしても同じコンテンツが表示されてしまう検索結果は、便利とはいえないからだ。したがってGoogleは、最も関連性が高い、最善のウェブページを1つ選択し、その他の(同一)コンテンツを非表示にする対応をとっている。

ウェブに公開されているコンテンツの25-30%が事実、重複しているという。Googleはインターネットで同一のコンテンツを見つけた時はそれらをクラスタリング(グルーピング)して、1つのコンテンツという扱いをする。そして関連性や重要性から最もベストなページを1つ選択するというわけだ。

How does Google handle duplicate content?

How does Google handle duplicate content and what negative effects can it have on rankings from an SEO perspective ? - Gray Taylor, Stratford Upon Avon, UK

ただし、悪意を持って生成された何の価値ももたらさない重複コンテンツはウェブスパムとみなす。例えば、他のサイトのRSSから丸ごと引用して自分のウェブサイトに展開しているようなケースだ。これは何の付加価値ももたらさない単なるコピーのため、ウェブスパムと判断しうる。

同じコンテンツの公開に注意:SEO「重複コンテンツ」問題

[重複コンテンツその1] IPv4 と IPv6 でホストするウェブサイトのコンテンツは重複扱いになりますか?

[重複コンテンツその2] レスポンシブWebデザインは重複コンテンツ扱いになりますか?

[重複コンテンツその3] コンテンツを複数言語に翻訳したものを異なるドメインで公開しています。重複コンテンツ扱いになりますか?

[重複コンテンツその4] 製品スペック表や栄養成分表など他サイトにもあるコンテンツを掲載することは重複コンテンツ扱いにありますか?

#1

この話題は、基本的に大規模サイト運営している方が気にすべきお話です。なぜなら、大規模サイトにおいては意図せず重複コンテンツが発生するケースが多々ありますし、その結果、意図しないページが検索流入ページになってしまうことがあるから。小規模サイトの場合はまず問題にならないはずです、問題になるなら、それ、怪しいことを意図的にやってないかを疑って下さい。今日のGoogleは、ちょっとした重複コンテンツは大概、上手に扱ってくれます。

#2

これはほんとよくある質問ですよね。実際、「プレスリリースをHTML版とPDF版の2つを用意した」「ウェブ閲覧用と印刷用の2つのバージョン」「新旧2つの取引契約書を用意している」といった具合に、日常のサイト運営においても必然的に2つ以上の(ほぼ)同一コンテンツを公開してしまうことはありうるので、Googleはこうした『ウェブの活動において必然的に発生しうる事柄』は原則としてウェブスパムとは判断しないのです。ただ、検索結果の品質や適合性の観点から、同一内容のページを1つの検索結果内に多数含めることは望ましくないので、非表示にするだけです。

この問題は、日本では常に OKWave - MSN相談箱 - 教えて!goo その他のOKWave系ネットワークが邪魔だという問題に関連づけられるんですが、ま、これは技術的に処理するの難しいので。。

COPYRIGHT © 1997-2020 渡辺隆広(わたなべ たかひろ) ALL RIGHTS RESERVED.

SEMリサーチ(www.sem-r.com)に掲載している文章及び図版の無断使用及び転載を禁じます。著作権侵害行為には厳正に対処します。

免責事項:SEMリサーチは、本記事中で触れている企業、商品、サービスの全て(情報)について、有用性、適合性、正確性、安全性、最新性、真実性に関する一切の保証をしておりません。各自の判断でご利用下さい。