2~3年前位でしょうか、よく「これはGoogleの重複コンテンツに該当するのか?」といった趣旨の相談を頻繁に受けました。最近はインターネット環境の変化により、新たな視点からの「これは重複コンテンツ?」系質問が増えているようです。
日本でも一部のISP事業者がIPv6 PPPoE接続やNTT東日本/西日本が提供するフレッツ・v6オプションと組み合わせてIPv6 IPoE接続を提供したり、一部のホスティングプロバイダがIPv6によるサービスを提供するなど、メリットはさておきIPv6 を利用できる環境が少しずつ整いつつあります。
さて、ウェブサイトをIPv6とIPv4 の両方でホストした場合、双方の(異なる)IPアドレスに同じコンテンツが展開されることになりますが、これを Google は重複コンテンツ扱いするのか?という質問に対して米Google マットカッツ氏が回答しました。
“Will having a site available on both IPv4 and IPv6 cause a duplicate content issue?”
As we are now closer than ever to switching to IPv6, could you please share some info on how Google will evaluate websites. One website being in IPv4, exactly the same one in IPv6, isn't it considered duplicate content ?
回答はもちろん No、重複コンテンツ扱いになりません。
# 個人的には、この手の質問は Google に聞くまでもない話で、くだらないとは思いますが、それはさておき…
上記のビデオにおいてマットカッツ氏はなぜこのケースが重複コンテンツに当たらないのか明確な説明をしていませんので、少し補足を。
これは重複コンテンツに限らず、一般的なGoogleの技術ガイドラインを解釈する上で適用できるのですが、『インターネットで広く普及している技術に Google (の検索アルゴリズム)は干渉しない』という原則を覚えておくとよいでしょう。
つまり、本件においては IPv4 と IPv6 が共存する時代が現存し、これが当面続くであろうことは明白であり、Google は"その環境" を前提にしてアルゴリズムを設計するということです。つまり、仮に IPv4 と IPv6 のIPアドレス上に同じコンテンツを公開することを重複コンテンツと判断・処理するのであれば、それは検索の理念に反する -- ユーザーに適切な検索結果を提示できない -- ことになりますので、それはしないのです。
あるいは、(これは過去に何度か述べましたが)インターネットの世界において慣習として定着してこと、普遍的な事柄に対して Google が自社の検索サービスのために相反するルールを提唱したとしても、誰が Google の利益のためにそのルールに従うでしょうか。
インターネット検索サービスというのは、現在のウェブの状況を受け入れたうえで、それを分析し、どのように素早く必要な情報を取り出すかを考えるアプローチをとります。たとえば PageRank という概念は、 Google がその概念を提唱して皆がリンクを張るようになったのではないですよね。そういうことです。