米Google、ニュース検索の再訪問(クロール)を強化

グーグルニュースが、ニュース記事収集に関して再訪問(recrawl)を強化。デッドリンクや古くなった記事見出しが表示されないようにして、常にユーザに最新のニュース記事を提供していく。


2010年02月02日 21:00 | Google 2010 | TrackBack (0) |

米Googleは2010年1月25日、ニュース検索において再クロールを強化し、常に最新の更新を反映した記事を検索・閲覧できるようにしたことを明らかにした。

Google Newsは、世界中のニュースソースをクロールして記事見出しを収集するとともに、類似した内容の記事をグルーピングして表示するニュース検索エンジン。公開されてわずか数分のニュース記事も取得することで、常に最新のニュースを探せるようになっている。

ニュース検索エンジンは、一般のウェブ検索と異なり、一度収集したニュース記事のページを何度も再訪問するわけではない。しかし、これが特有の問題を招く場合がある。

たとえば、一部のニュースソースは、記事公開後に誤字脱字の訂正を行ったり、話の進展があった場合にアップデートを追記したり、あるいはヘッドラインを変更する場合があるが、これらがGoogle Newsに反映されないケースは少なくない。また、これらの変更を加えた場合にURLが変更される場合もあるし、何らかの理由で記事が取り下げられる場合もあるが、やはりGoogle Newsはこうしたケースにリアルタイムに対応できているわけではなく、デッドリンクが検索結果に表示されてしまう場合があった。

こうした問題を解決するために、Google Newsはニュース記事の再クロール(recrawl)を強化することを決めた。特に何らかの修正が行われるのは公開されて最初の24時間に行われるケースが大半であることから、新しいニュース記事を発見して最初の24時間は特に再訪問を何度か行い変更の有無を確認する。24時間経過後は変更される確率が下がるため、クロール頻度を徐々に下げていく。また、最初の訪問時に何らかの理由で記事が取得できなかった場合も、再取得を試みるようにするという。

上記のようなニュース記事再取得のプロセス見直しにより、デッドリンクや古くなったヘッドラインの割合を減らし、最新ニュース記事の反映と古くなった記事のリアルタイム・アップデートを両立させていくとしている。

Google News Comes Back For More [Google News]
http://googlenewsblog.blogspot.com/2010/01/google-news-comes-back-for-more.html








最新の検索エンジン業界ニュース

▼[PR] 「検索にガンガンヒットさせるSEOの教科書」好評発売中
米Google、ニュース検索の再訪問(クロール)を強化
米Google、ソーシャル検索をベータ版として公開
電通、デジタルマーケティングの米Innovation Interactiveを買収
Yahoo!検索、インデックスを更新 (2010/01/26)
カスペルスキー、Google AdSense広告をトロイの木馬「Trojan.JS.Redirector.ar」と誤検知
トランスコスモス、DART事業を米Googleに譲渡
中国モトローラ、Android携帯のデフォルト検索に百度採用
▼「SEMリサーチ」トップへ戻る





免責事項:SEMリサーチは、本記事中で触れている企業、商品、サービスの全てについて一切の保証をしておりません。各自の判断でご利用下さい。





関連SEMサイト - SEM リサーチ | キーワードリスト自動生成ツール | キーワードアドバイスツールプロ

カテゴリ:Google (2006) | Google (2007) | Google (2008) | Google (2009) | MSN / Live Search | YST / Yahoo!検索 | SEO(検索エンジン最適化)
検索連動型広告 | ウェブ解析 | コンテンツ連動型広告>サイト内検索 | 地域情報検索 | 動画検索 | 旅行検索 | モバイル検索


運営者 - 『検索にガンガンヒットするホームページの作り方』 - 『検索にガンガンヒットさせるSEOの教科書』