Google、略語や英文字キーワードの処理方法を大きく改善 - Yahoo! & 百度と違いを比較

日本語の表記ゆれ問題、Yahoo!やLive Searchが(一部)未対応でGoogleが対応済みの問題が略語・英文字キーワードの処理方法。Googleは略語で検索しても正式名称を含むページを検索できる。


2008年05月06日 20:00 | Google 08 | TrackBack (0) |

検索エンジン各社の日本語クエリの処理方法の違い。Googleは略語を入力しても正式名称の文字列を持つページを検索できる

少なくとも昨年末時点で、Googleは日本語文字列の処理を大きく改善し、Yahoo!やMSN / Live Search、百度など他の日本語検索エンジンが実現できていない(Ask.jpがやってました)ことをしています。それが略語や英文字(英語表記)のキーワードを入力した時の処理方法です。

上記の表は、検索キーワードで検索した時に、検索結果でボールド表示(太字)される文字列を表したものです。例えば、「ファミマ」と検索した時に、Googleは検索結果ページに「ファミマ」「ファミリーマート」どちらもボールド表示します。検索結果にヒットしたページも、その他の要素(被リンク、アンカーテキスト、周辺テキスト)の影響によるものではないと考えられるものが多数含まれます。対して、Yahoo!などは、入力したキーワードそれ自体を含むページしか検索対象になっていません。もちろん、バックリンクやその他諸々の調整により、結果として「ファミマ」と検索しても意図される「ファミリーマート」は検索できます。

表に入れていませんが、他にも「mcafee」と「マカフィー」、「RSS feed」と「RSSフィード」、「スタバ」「スターバックス」、「samsung」「サムスン」、「cyberagent」「サイバーエージェント」なども同じ言葉として認識されているようです。

ただし、「gucci」と検索しても「グッチ」を、「PRADA」と検索しても「プラダ」を検索対象に含めていません。「Hermès」で「エルメス」、「doutor」で「ドトール」はボールド表示にならない、同じ言葉としての認識はしていません。

※ ここまでの段落、一部説明が不適当だったため、修正を加えてました

ファミリーマートなどのような社名やブランド、ナビゲーショナルクエリであればリンク分析を通じて目的サイトを検索結果に表示できるはずですが、そうではないクエリ(トランザクショナルなど)やミドル~テールのキーワードになってくると、こうした表記の違いで検索結果が大きく変わることは、時としてユーザーの検索負荷に影響を与えます。特に英文字とカタカナのどちらで入力した方が目的の情報にたどり着けるのか迷うような時、こうした関係する文字を同じように処理してくれる方が、検索意図を適切に反映できるでしょう。

ちなみに米国Googleでは、2003年4月28日に買収したApplied Semanticsが保有していたCIRCA技術を活用することで、例えば「payment」を「finance」と同じ意味を持つとみなして検索対象に含む、といったことを2003年末以降に実施していました(ちょうどGoogleアルゴリズムに大きな変更が加えられて騒がれていた頃です)。

一般に海外の検索会社は日本語処理能力がYahoo!JAPANに劣ると思われがちですが、現実にはGoogleもかなり日本語固有の問題にも対処しつつあります。

#
[追記] はてなブックマークのコメント欄にて「Ask.jpが対応してる」という指摘がありました。そういわれてみれば確かにやってましたよね、sony → ソニーなど。すみませんこのコラムを書いている時、Ask.jpの存在を忘れてました。

[追記2] 文字列判定の方法の違いについてまとめています。判定方法は、検索結果画面中におけるボールド表示となる言葉です。表記が違っても検索結果が全く一緒になるというわけではありません。また、検索結果の良し悪しでいえば、(他のすべての要素を計算してランク付けされた)結果としてYahoo!やその他検索エンジンの方が関連性が高いといえる場合もあります。つまり言語の処理の方法だけ変えても検索精度が良くなるわけでもないです。








最新の検索エンジン業界ニュース

▼[PR] 「検索にガンガンヒットさせるSEOの教科書」好評発売中
Bing、キーワードサジェストを強化、ホットな話題の候補表示が可能に
キーワードあたりの広告数、Googleは4.97、Bing は 3.39 - 米AdGooroo
@nifty、動画検索エンジンにACCESSPORTの「Woopie」採用
Google 67.3%、Bing 9.9% 米国 検索エンジンシェア 2009年12月 Nielsen
Google 65.7%, Bing 10.7% - 米国 検索エンジンシェア 2009年12月 - comScore
Bingキャンペーンの検索回数、100%に到達
Google、中国撤退の正式決定報道を否定
▼「SEMリサーチ」トップへ戻る





免責事項:SEMリサーチは、本記事中で触れている企業、商品、サービスの全てについて一切の保証をしておりません。各自の判断でご利用下さい。





関連SEMサイト - SEM リサーチ | キーワードリスト自動生成ツール | キーワードアドバイスツールプロ

カテゴリ:Google (2006) | Google (2007) | Google (2008) | Google (2009) | MSN / Live Search | YST / Yahoo!検索 | SEO(検索エンジン最適化)
検索連動型広告 | ウェブ解析 | コンテンツ連動型広告>サイト内検索 | 地域情報検索 | 動画検索 | 旅行検索 | モバイル検索


運営者 - 『検索にガンガンヒットするホームページの作り方』 - 『検索にガンガンヒットさせるSEOの教科書』