検索エンジン3社、正しいサイトURLを認識させるcanonical属性を導入(URLの正規化)

Google、Yahoo!、Microsoftの3社は2009年2月12日、共同で新しいタグ「 rel="canonical"」のサポートを開始した。rel="canonical"(属性)は、検索エンジンに正しいサイトのURLを認識(正規化、canonicalization)させるために使用される。

同じサイト(ドメイン)でも、たとえば www.sem-r.com、sem-r.com(wwwなし)、www.sem-r.com/default.asp、sem-r.com/default.asp?code=123 といった具合に、解析用パラメータをつけたり index.html 以外のファイルをトップページに設定するなどすることで、複数の異なるURLを持つケースがある。この場合、人間がブラウザで閲覧する場合はどのURLにアクセスしても問題はないが、検索エンジンのインデックスにおいては問題が発生する。

検索エンジンは各々のコンテンツが重複したURLを巡回し、登録した上で、その中で最も適合性の高いURLを見つけなければいけない。しかし、先述した例のようにパラメータの有無、wwwの有無により複数の組み合わせが生まれるURL候補で、しかもコンテンツがどれも同じという選択肢の中から正しい(canonical)URLを特定するのは、困難な場合がしばしばある。仮に、パラメータの組み合わせで100万のURLがあればクローラは100万のURLすべてをアクセスし、その中で最も適切なURLを見つけなければいけないからだ。

そこで検索大手3社は今回、canonical属性を導入。ここに正しいURLを記述することで、クローラはその情報を参考に適切なURLを特定する。linkタグは、301リダイレクト相当の取扱がされ、リンク評価など他の要素もcanonical で指定したURLに引き継がれる。また、全く同一のページ同士でなければ指定できないというわけではなく、ほぼ同じページ同士でもrel="canonical" 設定が可能だ。

<link rel="canonical" href="http://mysite.com"/>
(記述例:Webページの<head>~</head>の間に、rel="canonical"属性を追加する)

注意点として、ここcanonical属性に指定したものがクローラに対する命令として直接反映されるわけではなく、あくまで適切なページを特定するための手がかりとして利用される。他の情報のコンテクストと組み合わせて、検索エンジンが最も適切な(canonical)URLを決定する仕組みだ。

ちなみに、サイト内のどのページでも使用することができる。

たとえば、eコマースサイトにおいて、ある商品が複数のカテゴリに属する場合、それぞれのカテゴリの下に同一内容の商品紹介ページを設置することがある。具体的な例を挙げると、SONYのデジカメ「cyber-shot T700」の商品詳細ページが、(1) ブランド「デジカメ」カテゴリ、(2) ブランド「cyber-shot」カテゴリ、それぞれの直下に、コンテンツが全く同一(重複)ながら異なるURLで作成されたとしよう(こういうECサイトは結構ある)。この場合、商品詳細ページ「T700」が2ページ作成されることになるが、検索エンジンはどちらのページをインデックスすればいいのか判断ができない。

この時、rel="canonical" を使用して、インデックスさせたいURLを指定することで、検索エンジンは登録すべきページがどちらか判断・決定できるようになる。

Partnering to help solve duplicate content issues [Live Search Webmaster Central Blog]
http://blogs.msdn.com/webmaster/archive/2009/02/12/partnering-to-help-solve-duplicate-content-issues.aspx

Specify your canonical [Google]
http://googlewebmastercentral.blogspot.com/2009/02/specify-your-canonical.html

Fighting Duplication: Adding more arrows to your quiver [Yahoo! Search Blog]
http://ysearchblog.com/2009/02/12/fighting-duplication-adding-more-arrows-to-your-quiver/


#
リンクタグのcanonical属性は、複数のカテゴリに同一ページが異なるURLで存在している場合、wwwあり・なしが混在している場合、引数は異なるが内容が同一の多数のページが存在している場合に使用するといい。eコマースサイトの場合、色違い・カテゴリ違い・特典のありなし違いで内容がほぼ同一のURLが異なるページが多数作成されることがあるので、canonical属性で調整しても※いいかもしれない(※ 実務で試したことがないからわかんないですが, 2009/02/14)。

Googleモバイル、PCサイトと携帯サイトの混在表示を開始

Googleモバイルのウェブ検索が、一部の携帯端末においてPCサイトと携帯サイトを区別せずに混在表示していることが確認された。

従来、Googleモバイルは検索結果を一般サイトとPCサイトを区別し、それぞれの検索結果を関連性が高い順番で表示していた。今回docomoやSoftbankの一部の携帯端末で確認したのは、これらをわけ隔てなく混在して検索結果に並べる方式。ただし、各々のリンクにはアイコンがついており、携帯サイトかPCサイトかを識別できるようになっている。


#
検索利用者にとっては、情報ソースがどの端末向けで構築されているかは問題ではなく、自分が求めている情報がそのリンク先にあるかどうか。情報量が多いPCサイトも訳隔てなく、クエリに適合した結果を出せれば検索の利便性は高まる。フォーマットの問題はPC/携帯サイト変換技術で解決できるわけで。

Yahoo!JAPAN、トップページに「キーワード入力補助」機能を搭載

ヤフーは2009年2月12日夜、Yahoo!JAPANトップページの検索窓にキーワード入力補助機能を搭載した。

キーワード入力補助機能は検索窓にキーワードを入力している時、最初の何文字かが入力された時点で入力される候補を予測、表示するサービス。これまで、Yahoo!JAPANの検索トップ(search.yahoo.co.jp)やYahoo!ツールバーに同機能が搭載されていたが、今回はYahoo!JAPANトップページに搭載された。

Googleは2008年8月26日にトップ(検索トップ)に同等機能のGoogleサジェストを導入している。



おすすめ:最近のニュース記事

gooウェブ検索、キーワードと関連性高いTwitterツイートを検索可能に


NTTレゾナント株式会社が運営するgooウェブ検索は2012年1月23日、検索キーワードと関連性が高いTwitter上でつぶやかれたツイートを検索結果の上部に表示すると発表した。PC版とスマートフォン版のgoo検索が対応。


米Google、ページレイアウト分析アルゴリズムを改善 [詳細版]


米Googleは2012年1月19日、ウェブページのレイアウトやコンテンツボリュームを分析するアルゴリズムに変更を加えたことを明らかにした。同社Matt Cutts氏(Distinguished Engineer)は、検索利用者がより高品質なウェブサイトを発見できるようにするための改善策の1つだと述べている。


[解説][SEO] グーグル、「rel=alternate hreflang=x」サポートを拡張、多言語サイトを適切にインデックス可能に


米Googleは2011年12月5日、多言語サイトを適切にGoogleに登録・掲載するために、rel="alternate" hreflang="x" のサポートを拡張したことを発表した。


米Yahoo!、Search BOSSを刷新、3つの検索ソリューションを発表


米Yahoo!は2011年12月7日、Search BOSS(Build Your Own Search Service)の新しいウェブサイトを公開すると同時に、3つの検索ソリューション - BOSS Hosted Search, BOSS Site Search, BOSS Shortcutsを発表した。BOSS Hosted Search 及び BOSS Site Search は同日よりグローバルで提供を開始、BOSS Shortcutsは米国、カナダ、インド、英国での提供となる。


米Google、スマートフォンサイト専用のクローラを発表 Googlebot-Mobile


米Googleは2011年12月15日、スマートフォンサイトのコンテンツをクローリング(巡回)することを目的としたスマートフォン版Googlebot-Mobileクローラを発表した。スマートフォンユーザーの増加とともに急増するスマートフォン向けにデザインされたサイトコンテンツに対応する狙い。


Google、検索結果画面の+1ボタンの表示方法を変更


Googleが今週から、ウェブ検索結果画面におけるGoogle+1ボタンの表示方法を変更した模様だ。従来はデフォルトで+1ボタンが各リンクの右側に表示されていたが、現時点(2011年12月13日3時)でデフォルトでは非表示となった。


[SEO] 「位置情報やモバイル端末による振り分けはクローキングではない」Matt Cutts氏によるクローキング解説ビデオ


米GoogleのMatt Cutts氏(Distinguished Engineer)がクローキングについてビデオで解説を行った。














Ask.jp, Ask.com | Bing (Live Search) | Google 05-1 | Google 05-2 | Google 06 | Google 07 | Google 08 | Google 09 | Google 2010 - 2011 | SEO(検索エンジン最適化) | SES | Yahoo!検索 / YST | アクセス解析 / Web分析 | コンテクスト広告 | サイト内検索 | サーチニュース 07H1 | サーチニュース 07H2 | サーチニュース 08H1 | サーチニュース 09 | サーチニュース 2010 | サーチニュース 2011 | サーチニュース 2012 | ショッピング検索 | デスクトップ検索 | ニュース 05Q2 | ニュース 05Q3 | ニュース 05Q4 | ニュース 06H1 | ニュース 06H2 | モバイル検索 / 携帯検索 | リスティング広告 | ローカル検索 | 動画検索 | 旅行検索 | 検索イベント |

検索市場分析 | コンテンツターゲティング広告 | ポータル / ディレクトリ | Google 2003 | Google 2004 [I] | Google 2004 [II] | Google 2005 [I] | AdSense / アドセンス | AdWords / アドワーズ広告 | Froogle / フルーグル | ローカル検索 | モバイル検索 | MSNサーチ | Overture / オーバーチュア | PFI - ペイドインクルージョン | ショッピング検索 | ペイドリスティング(PPC) | 検索エンジンニュース 2004 [I] | 検索エンジンニュース - 2003 | 検索エンジンニュース 2004 [II] | 検索エンジンマーケティング SEM | SEO - 検索エンジン最適化 | SEM/SEOセミナー | サーチエンジンストラテジーズカンファレンス(SES) | 検索エンジンニュース 05Q1 | 検索エンジンニュース 05Q2 | SEO / 検索 統計 | Yahoo! / ヤフー | P4P |

関連SEMサイト - SEMリサーチ | SEO - FAQ | SEO(検索エンジン最適化) | キーワードアドバイスツールプロ

検索にガンガンヒットさせるSEOの教科書 付録 |
運営者 - 『検索にガンガンヒットするホームページの作り方』