Google、サイトマップページ形式はXMLとRSS/Atomフィードの両方を推奨

グーグル、ウェブクローラのクローリングを手助けするサイトマップページについて、XMLサイトマップとRSS/Atomフィードの両フォーマットの併用を推奨。


公開日時:2014年10月17日 17:57

米Google は2014年10月16日、「Best practices for XML sitemaps & RSS/Atom feeds」と題する記事を公開し、検索エンジンのクローリングを手助けする役割を持つサイトマップページの作成についてのアドバイスに言及した。

サイトマップページとは

サイトマップページとは、サイト内のウェブページ一覧を記したファイルのことで、Bing や Google などが稼働させるウェブクローラが効率的にサイト内のページを巡回・索引化していくことを支援する。ウェブ制作やユーザビリティの文脈でいう(ユーザーのための)サイトマップのことではなく、検索エンジンにサイトのページ構成を伝えるファイルのことを指してサイトマップページと呼ぶ。混同を避けるために便宜上XMLサイトマップと呼ぶ場合もある。

※おことわり:SEMリサーチ上の過去の記事では混同を避けるためにサイトマップページを便宜上XMLサイトマップと表記していますが、本記事はフォーマットの違いそのものが話題であることから(形式そのものを区別するために)「XMLサイトマップ」と「RSS/Atomフィード」の用語を用いています


XMLサイトマップとRSS/Atomフィードの形式の違いと役割

Google に送信するサイトマップページは、「XMLサイトマップ」と「RSS/Atomフィード」のどちらの種類・形式で記述することも可能だが、前者はサイト内の全てのURLを記述するものに対して、後者はサイト内の最近変更されたURLを記述するものである。

つまり、XMLサイトマップはサイト内の全てのURLを記述するため大きなファイルになるのに対して、最近の変更箇所を中心に記述RSS/Atomフィードは小さなファイルになる。また、サイト全体のページを記述することを目的としたXMLサイトマップがダウンロードされる頻度は、最近のアップデート内容を記述することを目的としたRSS/Atomフィードと比べると少なくなるということだ。


XMLサイトマップとRSS/Atomフィードの併用を推奨

両者にはこうした性格の違いがあることから、Google はクローラビリティの観点から両方の形式のファイルを扱うことを推奨している。本記事を個人の Google+アカウントで紹介している同社の John Mueller氏や Pierre Far氏も、両者を併用することを薦めている。

Google は記述時の注意事項として (1) サイトマップページに含める URL は Googlebot (あるいは Bingbot)がクロール許可されている URL のみにすること、(2) 正規化するURLのみを一覧に含めること、という2点を挙げている。

1点目は、例えば robots.txt ではクロールを拒否しているディレクトリやファイルをサイトマップページに記述しても意味がないという例を挙げている。同様に、404 Not Found の URLを含めても仕方がないので、サイトマップページのファイル作成時には URL が全て存在しクロールを希望する URL がリスト化されるように注意しなければならない。2点目は、例えば重複ページ(コンテンツ)の問題を解決するためにrel=canonical(カノニカル)を使用して URLを正規化する(≒ 内容が重複した URL のうち、Google がインデックスすべき URL がどれなのかを明示する)ことがあるが、サイトマップページにはその正規化する(インデックスさせたい)ページの URL のみを記述するとよい。

その他、原文では XMLサイトマップやRSS/Atomフィードの更新頻度やファイルに含めることが可能なURL数などについても言及しているので、興味のある方は参考にしてほしい(近日中に日本語翻訳版が公開される可能性が高いので、英語が苦手な方は日本語版を待つと良い)。

サイトマップ ページでサイトマップを管理する
https://support.google.com/webmasters/answer/183669?hl=ja

Best practices for XML sitemaps & RSS/Atom feeds
http://googlewebmastercentral.blogspot.jp/2014/10/best-practices-for-xml-sitemaps-rssatom.html


#
ユーザー向けに RSSフィードを提供しているサイトは、ウェブクローラー向けのサイトマップページとして XMLサイトマップを追加すればいいだけの話なので、それほど導入を阻む要素はない気がします





記事カテゴリ:Google 2010-2016


他の検索・SEO 関連の記事
新刊:ネットショップSEO 2014発売されました(2014年5月)
Google モバイルファーストインデックスのやさしい解説 (1) 何が発表されたの?
Google、モバイルファーストインデックスを公式発表、SEO への影響は?
スマホの音声認識、米国ユーザーの70%が満足、テキスト入力が3倍速いとの調査結果も
Yahoo! 検索、検索結果右側のテキスト広告を廃止か
[訂正版] Google、モバイルファーストインデックスを導入、モバイルサイトを基準とした評価へ
Google News、事実確認できた記事に Fact check ラベルを表示
[訂正] Google、モバイルファーストインデックスへ移行する計画を発表
ペンギンアップデートはリンク発信元ページを評価する(Google、Gary Illyes氏)
Google、進化したAI 採用の「Google Assitant」を発表
Bing App、AMPサポートを開始
「SEMリサーチ」トップへ戻る




免責事項:SEMリサーチは、本記事中で触れている企業、商品、サービスの全て(情報)について、有用性、適合性、正確性、安全性、最新性、真実性に関する一切の保証をしておりません。各自の判断でご利用下さい。