SEMリサーチ

企業で働くウェブマスター向けに、インターネット検索やSEOの専門的な話題を扱います

検索エンジン3社、正しいサイトURLを認識させるcanonical属性を導入(URLの正規化)

Google、Yahoo!、Microsoftの3社は2009年2月12日、共同で新しいタグ「 rel="canonical"」のサポートを開始した。rel="canonical"(属性)は、検索エンジンに正しいサイトのURLを認識(正規化、canonicalization)させるために使用される。

同じサイト(ドメイン)でも、たとえば www.sem-r.com、sem-r.com(wwwなし)、www.sem-r.com/default.asp、sem-r.com/default.asp?code=123 といった具合に、解析用パラメータをつけたり index.html 以外のファイルをトップページに設定するなどすることで、複数の異なるURLを持つケースがある。この場合、人間がブラウザで閲覧する場合はどのURLにアクセスしても問題はないが、検索エンジンのインデックスにおいては問題が発生する。

検索エンジンは各々のコンテンツが重複したURLを巡回し、登録した上で、その中で最も適合性の高いURLを見つけなければいけない。しかし、先述した例のようにパラメータの有無、wwwの有無により複数の組み合わせが生まれるURL候補で、しかもコンテンツがどれも同じという選択肢の中から正しい(canonical)URLを特定するのは、困難な場合がしばしばある。仮に、パラメータの組み合わせで100万のURLがあればクローラは100万のURLすべてをアクセスし、その中で最も適切なURLを見つけなければいけないからだ。

そこで検索大手3社は今回、canonical属性を導入。ここに正しいURLを記述することで、クローラはその情報を参考に適切なURLを特定する。linkタグは、301リダイレクト相当の取扱がされ、リンク評価など他の要素もcanonical で指定したURLに引き継がれる。また、全く同一のページ同士でなければ指定できないというわけではなく、ほぼ同じページ同士でもrel="canonical" 設定が可能だ。

<link rel="canonical" href="http://mysite.com"/>

(記述例:Webページの<head>~</head>の間に、rel="canonical"属性を追加する)

注意点として、ここcanonical属性に指定したものがクローラに対する命令として直接反映されるわけではなく、あくまで適切なページを特定するための手がかりとして利用される。他の情報のコンテクストと組み合わせて、検索エンジンが最も適切な(canonical)URLを決定する仕組みだ。

ちなみに、サイト内のどのページでも使用することができる。

たとえば、eコマースサイトにおいて、ある商品が複数のカテゴリに属する場合、それぞれのカテゴリの下に同一内容の商品紹介ページを設置することがある。具体的な例を挙げると、SONYのデジカメ「cyber-shot T700」の商品詳細ページが、(1) ブランド「デジカメ」カテゴリ、(2) ブランド「cyber-shot」カテゴリ、それぞれの直下に、コンテンツが全く同一(重複)ながら異なるURLで作成されたとしよう(こういうECサイトは結構ある)。この場合、商品詳細ページ「T700」が2ページ作成されることになるが、検索エンジンはどちらのページをインデックスすればいいのか判断ができない。

この時、rel="canonical" を使用して、インデックスさせたいURLを指定することで、検索エンジンは登録すべきページがどちらか判断・決定できるようになる。

Partnering to help solve duplicate content issues [Live Search Webmaster Central Blog]

http://blogs.msdn.com/webmaster/archive/2009/02/12/partnering-to-help-solve-duplicate-content-issues.aspx

Specify your canonical [Google]

http://googlewebmastercentral.blogspot.com/2009/02/specify-your-canonical.html

Fighting Duplication: Adding more arrows to your quiver [Yahoo! Search Blog]

http://ysearchblog.com/2009/02/12/fighting-duplication-adding-more-arrows-to-your-quiver/

#

リンクタグのcanonical属性は、複数のカテゴリに同一ページが異なるURLで存在している場合、wwwあり・なしが混在している場合、引数は異なるが内容が同一の多数のページが存在している場合に使用するといい。eコマースサイトの場合、色違い・カテゴリ違い・特典のありなし違いで内容がほぼ同一のURLが異なるページが多数作成されることがあるので、canonical属性で調整しても※いいかもしれない(※ 実務で試したことがないからわかんないですが, 2009/02/14)。

COPYRIGHT © 1997-2021 渡辺隆広(わたなべ たかひろ) ALL RIGHTS RESERVED.

お問い合わせ(お仕事の相談、講演依頼など)

SEMリサーチ(www.sem-r.com)に掲載している文章及び図版の無断使用及び転載を禁じます。著作権侵害行為には厳正に対処します。

免責事項:SEMリサーチは、本記事中で触れている企業、商品、サービスの全て(情報)について、有用性、適合性、正確性、安全性、最新性、真実性に関する一切の保証をしておりません。各自の判断でご利用下さい。