Googleが低品質コンテンツの排除を強化する方針を発表した背景として、先日NYSEに上場した米Demand Media対策という指摘もあります。Google公式発表には一切、Demand Mediaに言及はありませんが、背景事情的に、そう考えることに一定の合理性はあります。
今回はそのDemand Mediaのコンテンツと検索エンジンにとっての課題について簡単に説明します。
Demand Mediaは独自の予測アルゴリズム技術を用いてオンラインユーザが求めている情報の「需要」を解析して、それに合致する記事やビデオコンテンツを配信しているメディアです。同社は13,000人以上のフリーランサーや編集者を雇っており、彼らに1記事あたり15ドル程度と安価な対価を支払うことで1日あたり5000以上ものコンテンツを作成・公開しています。安価に大量のコンテンツを生産する「コンテンツミル」(Content Mill)のビジネスモデルを成功に導いたのです。
Demand Mediaの記事は、eHow.comやAnswerbag.com、Trails.com、Livestrong.com などのDemand Mediaネットワークを通じて配信しており、2010年12月の同ネットワークの訪問者数は6億7,300万人(comScore)に達しています。これらの大半は、検索エンジン、つまりGoogleの流入に依存しています。つまり、強力にSEOを駆使することで、検索エンジン上のビジビリティ(露出度)を最大化することで成立する事業モデルでもあります(収益はサイト上に掲載したGoogleの広告)。
ところで彼らの公開しているコンテンツは、決して面白いもの、ユニークなものではなく、極めて平凡です。たとえば eHow.comは、日常生活の様々な疑問や問題を解決するためのインストラクションを紹介する、いわば「生活の知恵」を集めたサイトです。たとえば、「靴ひもの結び方」「地図の作り方」「ビデオケーブルのつなぎ方」といった話題です。
しかし、安価に大量のコンテンツを、プロではないライターが低賃金で執筆していることから、品質的に問題のあるコンテンツも少なくありません。面白味もなく平凡なもの、内容が薄っぺらなコンテンツも目立ちます。ユーザの目を通せば、役に立たない、読むだけ時間の無駄といった記事が出てきます。ところが記事自体に検索されやすいキーフレーズを用いていたり、検索エンジンに評価されやすい仕組みを備えていることから、検索結果の上位にこうした低品質なコンテンツが次々とリストアップされています。結果として、ユーザから、Googleの検索品質や関連性が低下しているという指摘がなされるようになっているのです。
たとえば、eHow.comのサイトに、ある建築業界向けのソフトウェアのトラブルシューティングについての記事が掲載されています。しかし内容を見ると、単に「ソフトウェアをアンインストールして、Windows を再起動して、必要なら再インストールして」と、中身は至って普通のことしか書いてありませんでした(つまり、その記事のソフトウェアの部分を別のキーワード(たとえばMS Office や Adobe Acrobat など)に置き換えていくことで、無限に大量のコンテンツを生成することが可能になることも示している)。
あるいは、靴ひもの結び方について、最初のステップが「靴を履いていることを確認しましょう」で始まっているといった具合です。プラスチックの箱に穴が開いた時の修復方法についてのTIPSに至っては「テープで貼ろう」と、アイデアの欠片もない情報です。
コンテンツ自体の重複も目立ちます。内容はほぼ同一なのに、検索クエリにあわせてワーディングを変更したタイトルをつけることで、カバレッジ(表示数/検索キーワードのバリエーション)を増やしているのです。これらは実質的に重複・複製コンテンツです。
つまり、確かにコンテンツ(=文字情報)はあるし、キーワードとの関連性は(文字列上は)高い、従って関連する検索クエリで検索上位に表示されやすいしのですが、人間の目から見ると低品質(low-quality content)なわけです。ところがGoogleは、コンテンツが文字列的にキーワードとの関連性の程度を判断することができても、それの質(ユーザにとって有益となりうる情報なのか)は判断することができません。特にDemand Mediaネットワークの場合、日々大量のコンテンツがオンラインに公開され、増殖している以上、従来のランキングアルゴリズムでは「非常に優れたサイト」(authority site)と判断するしかないのです。
何の価値もない、無益なコンテンツを検索上位に表示するという状況は、とてもGoogleが検索ユーザのニーズに応えているとは言えません。こうした状況を放置することは、Google離れにもつながるでしょう。だからGoogleは、こうした人間の目で見て評価できない、低品質なコンテンツを検索結果から排除するために、本腰を入れなければいけない時が来ているのです。
(後編に続く)