SEMリサーチ

企業で働くウェブマスター向けに、インターネット検索やSEOの専門的な話題を扱います

ヤフー、Webサイトのインデックス状態を把握する「Yahoo!検索サイトエクスプローラー」日本語ベータ版を公開

Yahoo!検索サイトエクスプローラー

やっとデタ。Yahoo!検索 サイトエクスプローラー公開 [Yahoo!検索スタッフブログ]

http://searchblog.yahoo.co.jp/2008/05/yahoo_63.html

ヤフー株式会社は2008年5月14日、Yahoo!検索でのインデックス状態を把握する「Yahoo!検索サイトエクスプローラー」日本語ベータ版を公開した。

Yahoo!検索サイトエクスプローラーは、米国で2005年11月に公開されたYahoo! Site Explorerの日本語版。Yahoo!検索でのバックリンクやインデックス数、動的URLの処理方法の設定、スパム報告など、サイト運営者向けのサービスを提供する。

米国のSite Explorerをベースに日本独自の機能が追加されており、Yahoo!ブックマークの登録数やYahoo!ブログ検索での言及数を参照することもできる。

Yahoo!検索 サイトエクスプローラーの紹介

Yahoo!検索サイトエクスプローラーとは、Yahoo!の検索エンジン(YST)にインデックスされているページやバックリンク情報を確認できる、サイト管理者向けのサービスです。Googleの「ウェブマスターツール」や、MSN / Live Searchの「ウェブマスターセンター」に相当する機能です。

サイト管理者が認証手続き行うことにより多数の情報を閲覧できるようになります。具体的には、YSTにインデックスされているページ数、サイト内外から張っているリンク、クローラによるページ言語の判定、最終クロール日などの情報を表示します。これらのデータは TSVやXML形式でダウンロードすることも可能です。クローラ用サイトマップフィード(sitemap.org規格)の受付にも対応し、サイトエクスプローラーからフィード用に設定されたURLの確認や、フィードの処理状況も確認できます。

動的URLを効率よくクロールさせるしくみを提供

効果測定や、Web閲覧用と印刷用ページなどの区別をする目的で、コンテンツがほぼ同一でありながらURLに付与されるパラメータが異なる場合があります。たとえば、前者であればリファラを把握するために ?sourceid= などの文字列を、後者であれば ?view=print などの文字列をつけるケースがあります。

ブラウザ(人)はこれらは全く同じページ(コンテンツ)であると認識できますが、クローラはそれぞれを別ページと判断することがあります。この場合、次のような問題を引き起こす可能性があります。

(1) パラメータが異なる大量のウェブページを永続的にクロールすることによるサーバへの負荷増大

(2) 重複コンテンツと判定されたことで検索上位に表示されにくくなる

(3) 重複と判定されなかった場合、同じページが順位を争う、サイト内競合が発生

(4) パラメータが異なるURLそれぞれにバックリンクが集まると、リンク分散(link fragmentation)が発生し、評価分散による検索結果の低下

こうした問題を解決するのがサイトエクスプローラーの提供する動的URLの処理設定です。たとえば、sourceid という文字列を削除する、YST用にユニークなセッションIDを渡す、などの指示をYSTに出すことで、効率よくサイトをインデックスさせることが可能になります。

リンクスパム報告も可能

Yahoo!検索サイトエクスプローラーはリンクスパムをするウェブページを報告する機能も搭載しています。バックリンク一覧ページに表示されたリンクからスパムサイトを発見した場合、それを報告することができます。報告された情報は、YSTのスパム判定機能の精度向上やスケーラビリティのあるフィルタリング技術の開発に利用されます。また、管理するサイトがリンクファームに関与すると誤って判定されることを防ぐ目的もあります。

Yahoo!検索サイトエクスプローラー インデックス状況の管理画面

GoogleウェブマスターツールやLive Search ウェブマスターセンターと比較

Google、Yahoo!、MSN / LiveSearch 主要3社とも、サイト管理者向けのコンソールを提供しています。Googleウェブマスターツールと本ページで紹介するYahoo!検索サイトエクスプローラーは日本語に対応し、Live Search ウェブマスターセンターは日本語未対応ですが日本のサイトも登録できます。

3社のサービスを比較すると、最も情報の網羅性が高く機能豊富なのがGoogleウェブマスターツール。単にインデックスやバックリンクだけでなく、サイト内外リンクのアンカーテキストやRSSフィードの購読数、検索上位に表示されるキーワードと実際にクリックされるキーワードなど、様々な情報を提供します。スパム報告だけでなく、自分のサイトにガイドライン違反がある場合はそれを指摘してくれます。Googleとサイト管理者のコミュニケーションの橋渡し的役割も兼ねています。

Yahoo!検索サイトエクスプローラーは動的URLの処理を指示できるところが他社にないユニークな機能をもちます。ブックマーク数やブログ検索の言及数が見られるのも◎。Yahoo!は効率よくサイトがクロールし、コンテンツのありかを探せるようなしくみ提供において、とても親切な会社です。

Live Searchウェブマスターセンターは、「基本は抑えた」といった感じです。日本におけるプレゼンスがほとんどないに等しい現状においては、趣味として。

日本のサイト管理者はとりあえず、GoogleウェブマスターツールとYahoo!検索サイトエクスプローラーの利用は必須、といったところでしょう。案外、自分が知らなかったエラーに気づかされます。robots.txtの記述間違いとか、タイトルやMETAの重複とか。

Yahoo!検索サイトエクスプローラー

http://siteexplorer.search.yahoo.co.jp/

Yahoo!検索サイトエクスプローラー ヘルプページ

http://help.yahoo.co.jp/help/jp/siteexplorer/

サイトの認証方法(Yahoo!検索エクスプローラーを活用するなら必須)

http://help.yahoo.co.jp/help/jp/siteexplorer/siteexplorer-09.html

#

ほんと、やっと出たって感じ。2年以上かかってるよ でもローカライズよくされてます。米国版よりUIわかりやすいし、軽いし、日本独自の機能追加しているし。時間かけただけのことはあります。

COPYRIGHT © 1997-2021 渡辺隆広(わたなべ たかひろ) ALL RIGHTS RESERVED.

お問い合わせ(お仕事の相談、講演依頼など)

SEMリサーチ(www.sem-r.com)に掲載している文章及び図版の無断使用及び転載を禁じます。著作権侵害行為には厳正に対処します。

免責事項:SEMリサーチは、本記事中で触れている企業、商品、サービスの全て(情報)について、有用性、適合性、正確性、安全性、最新性、真実性に関する一切の保証をしておりません。各自の判断でご利用下さい。