検索エンジン3社、正しいサイトURLを認識させるcanonical属性を導入(URLの正規化)

Google、Yahoo!、Microsoft3社が rel="canonical" (正規化、canonicalization )をサポート。クローラが適切な(canonical)サイトを見つける手がかりに。rel="canonical" はページの head の中に記述すること。


公開日時:2009年02月13日 15:37

Google、Yahoo!、Microsoftの3社は2009年2月12日、共同で新しいタグ「 rel="canonical"」のサポートを開始した。rel="canonical"(属性)は、検索エンジンに正しいサイトのURLを認識(正規化、canonicalization)させるために使用される。

同じサイト(ドメイン)でも、たとえば www.sem-r.com、sem-r.com(wwwなし)、www.sem-r.com/default.asp、sem-r.com/default.asp?code=123 といった具合に、解析用パラメータをつけたり index.html 以外のファイルをトップページに設定するなどすることで、複数の異なるURLを持つケースがある。この場合、人間がブラウザで閲覧する場合はどのURLにアクセスしても問題はないが、検索エンジンのインデックスにおいては問題が発生する。

検索エンジンは各々のコンテンツが重複したURLを巡回し、登録した上で、その中で最も適合性の高いURLを見つけなければいけない。しかし、先述した例のようにパラメータの有無、wwwの有無により複数の組み合わせが生まれるURL候補で、しかもコンテンツがどれも同じという選択肢の中から正しい(canonical)URLを特定するのは、困難な場合がしばしばある。仮に、パラメータの組み合わせで100万のURLがあればクローラは100万のURLすべてをアクセスし、その中で最も適切なURLを見つけなければいけないからだ。

そこで検索大手3社は今回、canonical属性を導入。ここに正しいURLを記述することで、クローラはその情報を参考に適切なURLを特定する。linkタグは、301リダイレクト相当の取扱がされ、リンク評価など他の要素もcanonical で指定したURLに引き継がれる。また、全く同一のページ同士でなければ指定できないというわけではなく、ほぼ同じページ同士でもrel="canonical" 設定が可能だ。

<link rel="canonical" href="http://mysite.com"/>
(記述例:Webページの<head>~</head>の間に、rel="canonical"属性を追加する)

注意点として、ここcanonical属性に指定したものがクローラに対する命令として直接反映されるわけではなく、あくまで適切なページを特定するための手がかりとして利用される。他の情報のコンテクストと組み合わせて、検索エンジンが最も適切な(canonical)URLを決定する仕組みだ。

ちなみに、サイト内のどのページでも使用することができる。

たとえば、eコマースサイトにおいて、ある商品が複数のカテゴリに属する場合、それぞれのカテゴリの下に同一内容の商品紹介ページを設置することがある。具体的な例を挙げると、SONYのデジカメ「cyber-shot T700」の商品詳細ページが、(1) ブランド「デジカメ」カテゴリ、(2) ブランド「cyber-shot」カテゴリ、それぞれの直下に、コンテンツが全く同一(重複)ながら異なるURLで作成されたとしよう(こういうECサイトは結構ある)。この場合、商品詳細ページ「T700」が2ページ作成されることになるが、検索エンジンはどちらのページをインデックスすればいいのか判断ができない。

この時、rel="canonical" を使用して、インデックスさせたいURLを指定することで、検索エンジンは登録すべきページがどちらか判断・決定できるようになる。

Partnering to help solve duplicate content issues [Live Search Webmaster Central Blog]
http://blogs.msdn.com/webmaster/archive/2009/02/12/partnering-to-help-solve-duplicate-content-issues.aspx

Specify your canonical [Google]
http://googlewebmastercentral.blogspot.com/2009/02/specify-your-canonical.html

Fighting Duplication: Adding more arrows to your quiver [Yahoo! Search Blog]
http://ysearchblog.com/2009/02/12/fighting-duplication-adding-more-arrows-to-your-quiver/


#
リンクタグのcanonical属性は、複数のカテゴリに同一ページが異なるURLで存在している場合、wwwあり・なしが混在している場合、引数は異なるが内容が同一の多数のページが存在している場合に使用するといい。eコマースサイトの場合、色違い・カテゴリ違い・特典のありなし違いで内容がほぼ同一のURLが異なるページが多数作成されることがあるので、canonical属性で調整しても※いいかもしれない(※ 実務で試したことがないからわかんないですが, 2009/02/14)。





記事カテゴリ:サーチニュース 09
他の検索・SEO 関連の記事
新刊:ネットショップSEO 2014発売されました(2014年5月)
Googleマイビジネス、レビュー投稿ガイドラインを更新、レビューの選別や誘導を禁止
Googleモバイル検索が仕様変更、無限スクロール採用
グーグル、モバイルファーストインデックスへの移行を発表
グーグル、ダイレクトアンサーで「検索結果を表示しない」試験を中止
被写体の関連情報を表示する Google Lens が Android で利用可能に
Google、数週間内にも多くのサイトをモバイルファーストインデックスに移行
Google、画像検索結果の一部機能を廃止
Google検索、直接ホテル予約が可能に
Google、12月中旬の順位変動は日常的なアルゴリズム改良の一環と説明 業界では マカビーアップデート と命名も
グーグル、健康・医療に関連するページ評価方法を変更
「SEMリサーチ」トップへ戻る




免責事項:SEMリサーチは、本記事中で触れている企業、商品、サービスの全て(情報)について、有用性、適合性、正確性、安全性、最新性、真実性に関する一切の保証をしておりません。各自の判断でご利用下さい。