Google、HTMLフォームの送信先ページをクロールする実験を開始

Google、HTMLフォームの先のページのクロールを実験的に開始。getメソッドを利用していること、password や loginsなどのフィールドを持つ(会員限定サイトなどクロールが望まれていないサイト)をgooglebotが辿ることはない。


2008年04月13日 00:09 | サーチニュース 08H1 | TrackBack (0) |

米Googleは2008年4月11日、HTMLフォームの送信先をクロールする実験を開始したことを明らかにした。これは、検索エンジンがアクセスできないウェブページの総称、いわゆる「インビジブルウェブ(Invisible Web)」領域内にあるコンテンツのカバレッジを増やす狙い。この試みはGoogleが選択したほんの一部の高品質なサイトに限定して実施されている。

これまでGoogleはJavaScriptやFlashなど、かつてクロールできなかったコンテンツを解析して発見したリンクを辿るなどの改良を行ってきた。今回はgetメソッドを持つ、FORM要素を発見した場合、セレクトメニューやチェックボックス上に出現した言葉、あるいは当該ページ上から抽出した任意のキーワードを使ってフォーム先のクロールを試みる。ただし、getメソッドではない、password や logins、userids、contactsなどのフィールドを持つフォームはクロール対象外。また、当然ながら robots.txt で当該フォームのURLのクロールが禁止されている場合も巡回は行わない。

あくまでインビジブルウェブ領域のインデックスを増やすための試みに過ぎないため、HTMLフォームの先のページも通常のウェブページと同様に取り扱われるし、ランキングやPageRankなどで特別な措置がとられることもない。

ちなみに、Googleは同社のウェブ検索結果の中に検索結果へのリンクが表示されることをユーザーのサーチエクスペリエンスの観点から好ましいとは考えていない。例えば米Technoratiは意図的に同社の検索結果が検索にヒットしやすいように施策しているが、ユーザーは検索結果から検索結果へ誘導されてしまうため、Technoratiにとってはトラフィックを獲得できるがユーザーに”回答”が示されるわけではないからだ。

もしHTMLフォームをクロールする場合、サイト上に設置されたサイト内検索結果をクロールしうることになる。SearchEngineLandのDanny Sullivan氏のこうした疑問に対し、米GoogleエンジニアのMatt Cutts氏は、今回の施策は検索結果をクロールするのではなく新しいリンクを発見することに重きがおかれており、ウェブサーバに配慮しつつ効率よく新しいリンクを見つけられていると説明している。
Crawling through HTML forms [Official Google Webmaster Central Blog]
http://googlewebmastercentral.blogspot.com/2008/04/crawling-through-html-forms.html

Solved: another common site review problem [Matt Cutts: Gadgets, Google, and SEO]
http://www.mattcutts.com/blog/solved-another-common-site-review-problem/

#
Googleが発表しているとおり「一部のサイト限定」なので多数の一般サイト管理者が気にする話ではない。

そもそもHTMLフォームはクロールされにくい仕様であることに変わりないので、SEO(=検索エンジンフレンドリーなサイト)を構築するならセレクトメニューなどでナビゲーションを作らないこと。








最新の検索エンジン業界ニュース SEMリサーチ RSS 1.0SEMリサーチ

▼[PR] 「検索にガンガンヒットさせるSEOの教科書」好評発売中
ネイバー、新検索サービスのクローズドβユーザ募集開始
GoogleからYouTubeへの訪問者、80%以上がナビゲーショナルクエリ以外で流入 - Jストリーム調査
グーグル、「検索エンジン最適化スターターガイド」日本語版公開
米MS BingのTV CM (動画)
米MS、モバイル検索「Bing for mobile」公開 - PCページの閲覧性高める機能搭載
BingやTwitterが中国でアクセス不能に
アイレップ、検索特化型分析ツール「Enquisite Optimizer」販売開始
▼「SEMリサーチ」トップへ戻る




免責事項:SEMリサーチは、本記事中で触れている企業、商品、サービスの全てについて一切の保証をしておりません。各自の判断でご利用下さい。





関連SEMサイト - SEM リサーチ | キーワードリスト自動生成ツール | キーワードアドバイスツールプロ

カテゴリ:Google (2006) | Google (2007) | Google (2008) | Google (2009) | MSN / Live Search | YST / Yahoo!検索 | SEO(検索エンジン最適化)
検索連動型広告 | ウェブ解析 | コンテンツ連動型広告>サイト内検索 | 地域情報検索 | 動画検索 | 旅行検索 | モバイル検索


運営者 - 『検索にガンガンヒットするホームページの作り方』 - 『検索にガンガンヒットさせるSEOの教科書』