SEMリサーチ

SEMリサーチ

米Google、表形式データから事実を抽出・表示する「構造化スニペット」を発表

米Google は2014年9月23日、ウェブ検索結果のスニペット(説明文欄)に、検索クエリに関連する既成の事実や正確な情報を表示する Structured Snippets (構造化スニペット)をリリースした。日本語検索結果でも一部の情報は対応している。

Structured Snippets (構造化スニペット)とは

Googleは近年、整理され関連性が高いデータを検索利用者に提供するために開発されたナレッジグラフや他のデータソースによって支えられた数々の機能によって進化してきた。本日発表された構造化スニペットはさらに発展させたもので、ウェブページに掲載された表形式データから、動かぬ事実や正確なデータと推定される情報を抽出して、スニペットの一部として検索結果に表示する機能だ。

例えば "nikon d7100" (※ ニコンのデジタル一眼レフのカバン)で検索すると、検索結果に表示される dpreview.com の通常のスニペットの下欄に、同ページの一覧表に掲載されていたこセンサーの有効画素数や撮像素子、カメラの重さについての情報を抽出して表示されることが確認できる。

構造化スニペットの表示例

その他、次のような検索クエリで構造化スニペットを確認することができる。

  • 検索クエリ:mysql
    安定版のバージョンとリリース日、ライセンスの種類、開発者の名前が表示される(Stable release, License, Developer(s))
  • 検索クエリ:Facebook
    本社所在地や設立日が表示される(Headquarters, Founded)
  • 検索クエリ:Boston Marathon
    最高記録と開催日が表示される(Course records, Date)
  • 検索クエリ:us open
    (テニスの全米オープン)賞金金額や開催場所、直近の優勝者の名前が表示される(Prize money, Venue, Location, Current champions)
  • 検索クエリ:cent OS
    OSの種類やライセンスの種類が表示される(OS family, License)
  • 検索クエリ:孫悟空(son goku)や孫悟飯(son gohan)、べジータ(vegeta)などドラゴンボールの登場人物名
    アニメ版の担当声優やそのキャラクターの初登場タイトルが表示される(Voiced by, First appearance)
  • 検索クエリ:ファイナルファンタジー
    (final fantasy)ゲームのジャンルや第1作のタイトルとリリース日、最新タイトルとそのリリース日が表示される(First release, Genres, Latest release)
  • 検索クエリ:FIFA world cup
    開催期間と開催国、参加チーム数が表示される(Dates, Teams, Host country, Venue(s))

構造化スニペットはウェブ検索チームと Google Research の共同開発

Google Research 所属の WebTables研究チームは、インターネット上に散在する数々の表形式データを抽出・理解して、そこに埋もれた特に関連性の高い情報を検索利用者の目に触れやすくするための取り組みを行ってきた。こうした取り組みで得られたデータは Google Docs や Google Slides 内のリサーチツールで利用されている。

構造化スニペットは Google Research と Google ウェブ検索チームが共同で取り組んだ最新のプロダクトで、こうした表形式データを活用して常に最も関連性の高い情報を検索利用者に提供することを可能にするものだ。関連性のあるデータを取り出すために機械学習の手法を利用して、映画出演俳優や試合日程、製品仕様といった意味のある情報・事実を整理している表形式データと、レイアウト構成のために用いられたそれ自体は事実や事実を整理していない表形式データを機械的に区別する試みをしているという。また、構造化スニペットの開発にあたり、追加のアルゴリズムを導入して、スニペット欄に表示する情報の品質や関連性の計算も行っている。この構造化スニペットは最大4つの事実・情報を表示する仕組みのため、関連性が高いものをアルゴリズムで判定している。

Introducing Structured Snippets, now a part of Google Web Search [Google Research Blog - The latest news from Research at Google]

http://googleresearch.blogspot.jp/2014/09/introducing-structured-snippets-now.html

リッチ スニペットと構造化データについて

https://support.google.com/webmasters/answer/99170?hl=ja

#

リッチスニペットと似ていますが、テーブルのデータを解析するというところが違うのかと。

COPYRIGHT © 1997-2020 渡辺隆広(わたなべ たかひろ) ALL RIGHTS RESERVED.

SEMリサーチ(www.sem-r.com)に掲載している文章及び図版の無断使用及び転載を禁じます。著作権侵害行為には厳正に対処します。

免責事項:SEMリサーチは、本記事中で触れている企業、商品、サービスの全て(情報)について、有用性、適合性、正確性、安全性、最新性、真実性に関する一切の保証をしておりません。各自の判断でご利用下さい。