検索エンジン3社、正しいサイトURLを認識させるcanonical属性を導入(URLの正規化)

Google、Yahoo!、Microsoft3社が rel="canonical" (正規化、canonicalization )をサポート。クローラが適切な(canonical)サイトを見つける手がかりに。rel="canonical" はページの head の中に記述すること。


2009年02月13日 15:37 | サーチニュース 09 | TrackBack (3) |

Google、Yahoo!、Microsoftの3社は2009年2月12日、共同で新しいタグ「 rel="canonical"」のサポートを開始した。rel="canonical"(属性)は、検索エンジンに正しいサイトのURLを認識(正規化、canonicalization)させるために使用される。

同じサイト(ドメイン)でも、たとえば www.sem-r.com、sem-r.com(wwwなし)、www.sem-r.com/default.asp、sem-r.com/default.asp?code=123 といった具合に、解析用パラメータをつけたり index.html 以外のファイルをトップページに設定するなどすることで、複数の異なるURLを持つケースがある。この場合、人間がブラウザで閲覧する場合はどのURLにアクセスしても問題はないが、検索エンジンのインデックスにおいては問題が発生する。

検索エンジンは各々のコンテンツが重複したURLを巡回し、登録した上で、その中で最も適合性の高いURLを見つけなければいけない。しかし、先述した例のようにパラメータの有無、wwwの有無により複数の組み合わせが生まれるURL候補で、しかもコンテンツがどれも同じという選択肢の中から正しい(canonical)URLを特定するのは、困難な場合がしばしばある。仮に、パラメータの組み合わせで100万のURLがあればクローラは100万のURLすべてをアクセスし、その中で最も適切なURLを見つけなければいけないからだ。

そこで検索大手3社は今回、canonical属性を導入。ここに正しいURLを記述することで、クローラはその情報を参考に適切なURLを特定する。linkタグは、301リダイレクト相当の取扱がされ、リンク評価など他の要素もcanonical で指定したURLに引き継がれる。また、全く同一のページ同士でなければ指定できないというわけではなく、ほぼ同じページ同士でもrel="canonical" 設定が可能だ。

<link rel="canonical" href="http://mysite.com"/>
(記述例:Webページの<head>~</head>の間に、rel="canonical"属性を追加する)

注意点として、ここcanonical属性に指定したものがクローラに対する命令として直接反映されるわけではなく、あくまで適切なページを特定するための手がかりとして利用される。他の情報のコンテクストと組み合わせて、検索エンジンが最も適切な(canonical)URLを決定する仕組みだ。

ちなみに、サイト内のどのページでも使用することができる。

たとえば、eコマースサイトにおいて、ある商品が複数のカテゴリに属する場合、それぞれのカテゴリの下に同一内容の商品紹介ページを設置することがある。具体的な例を挙げると、SONYのデジカメ「cyber-shot T700」の商品詳細ページが、(1) ブランド「デジカメ」カテゴリ、(2) ブランド「cyber-shot」カテゴリ、それぞれの直下に、コンテンツが全く同一(重複)ながら異なるURLで作成されたとしよう(こういうECサイトは結構ある)。この場合、商品詳細ページ「T700」が2ページ作成されることになるが、検索エンジンはどちらのページをインデックスすればいいのか判断ができない。

この時、rel="canonical" を使用して、インデックスさせたいURLを指定することで、検索エンジンは登録すべきページがどちらか判断・決定できるようになる。

Partnering to help solve duplicate content issues [Live Search Webmaster Central Blog]
http://blogs.msdn.com/webmaster/archive/2009/02/12/partnering-to-help-solve-duplicate-content-issues.aspx

Specify your canonical [Google]
http://googlewebmastercentral.blogspot.com/2009/02/specify-your-canonical.html

Fighting Duplication: Adding more arrows to your quiver [Yahoo! Search Blog]
http://ysearchblog.com/2009/02/12/fighting-duplication-adding-more-arrows-to-your-quiver/


#
リンクタグのcanonical属性は、複数のカテゴリに同一ページが異なるURLで存在している場合、wwwあり・なしが混在している場合、引数は異なるが内容が同一の多数のページが存在している場合に使用するといい。eコマースサイトの場合、色違い・カテゴリ違い・特典のありなし違いで内容がほぼ同一のURLが異なるページが多数作成されることがあるので、canonical属性で調整しても※いいかもしれない(※ 実務で試したことがないからわかんないですが, 2009/02/14)。








最新の検索エンジン業界ニュース

米Parallels、GoogleサービスをPlesk 9.5に統合
Googleツールバー、気になった言葉を1クリックで検索できる機能を追加
米MS Bing、Twitter検索をBing本体に統合 - ツイートと言及数多い注目記事を表示
Googleウェブマスターツール、順位ごとの表示回数やクリックスルー情報を閲覧可能に
米Google、Twitterでフォロー相手を提案するGoogle Follow Finder公開
米Google、Twitterの過去のツイートを検索可能に
ヤフー、「Yahoo!検索プラグイン開発ツール」公開
▼「SEMリサーチ」トップへ戻る




免責事項:SEMリサーチは、本記事中で触れている企業、商品、サービスの全て(情報)について、有用性、適合性、正確性、安全性、最新性、真実性に関する一切の保証をしておりません。各自の判断でご利用下さい。





関連SEMサイト - SEM リサーチ | キーワードリスト自動生成ツール | キーワードアドバイスツールプロ

カテゴリ:Google (2006) | Google (2007) | Google (2008) | Google (2009) | MSN / Live Search | YST / Yahoo!検索 | SEO(検索エンジン最適化)
検索連動型広告 | ウェブ解析 | コンテンツ連動型広告>サイト内検索 | 地域情報検索 | 動画検索 | 旅行検索 | モバイル検索


運営者 - 『検索にガンガンヒットするホームページの作り方』 - 『検索にガンガンヒットさせるSEOの教科書』