- AIが回答する「NeevaAI」機能を追加
- AI生成回答の参照元を表示
- NeevaAIの回答例
- NeevaAI(や他の類似検索エンジンは)Googleの牙城を崩せるか
- 参考:AI生成コンテンツに対するGoogleの見解
AIが回答する「NeevaAI」機能を追加
新興の検索エンジン・NeevaAIは2023年1月6日、ジェネレーティブAIを搭載した検索機能「NeevaAI」ベータ版を発表した。同社のブログによると米国内のNeevaアカウント保持者が利用できるとの記載があるが、日本国内からも有償アカウントの申込み、およびNeevaAIが利用できることを確認している(2023年1月1日時点)。
Neevaは2019年創業。元GoogleのSridhar Ramaswamy氏とVivek Raghunathan氏が立ち上げた検索エンジン。従来の検索エンジンは検索広告収入によるビジネスが主流だったのに対し、Neevaは月額課金のサブスクリプションベースのビジネスモデルを採用している。かわりにプライバシー保護や広告非表示などユーザーの立場にたった特色を打ち出している。
昨年11月にOpenAIが公開したChatGPT(とそれに類似する技術)は、「10本の青いリンクで候補を表示する」という従来の検索エンジンのスタイルを大きく変革する可能性があるとの指摘もある。検索利用者はその瞬間のニーズにあった直接的な「回答」が欲しいのであって「(答えがあるかもしれない)候補」が欲しいわけではないからだ。
RamaswamyはChatGPTの課題を2つ挙げている。第1に ChatGPTのアウトプットはその情報源や参照元を表示しないことだ。このため利用者が ChatGPTの出力内容の信頼性を確認することを難しくしている。第2に、ChatGPTが持つデータは2021年以前のものであり、リアルタイムな(最新の)データを反映していない。時事的な話題について知りたいユーザーには残念ながら役に立たないというわけだ。
AI生成回答の参照元を表示
NeevaAIはこの2つの課題を次のアプローチで解決している。NeevaAIが出力する情報は、検索語句に関連する複数のウェブページの内容を要約し、単一の回答を表示する。AIが回答生成に利用した情報源はその回答枠の下部に参照元としてリンクを記載する方式を採用した。検索利用者は、NeevaAIの回答を閲覧しつつも、必要におうじてその参照元もあわせて確認することで信頼性も判断することができる。
また、Neevaは自社で構築した検索インフラを利用して毎日数百万の最新のウェブページをインデックスするほか、BingやAppleなど分野別のパートナー企業のデータも取り込んだうえで最新情報もNeevaAIで出力できるようにしている。
NeevaAIの回答例
実際に試した例を紹介する。「Playstation 5の入手が困難なのはなぜ?」という質問にたいして COVID-19や半導体不足の影響を理由としてあげている。また、PS5の需要は大きいため生産がスムーズに行われるようになっても入手は難しいかもとも説明している。問題なさそう。
「PS6の入手が難しいのはなぜ?」と質問すると、PS6はまだリリースされていないよと教えてくれた。これは従来のGoogleには出せなかった回答の類いだと思う。ちなみに Googleで "Why is it hard to get ps6?"と尋ねると、PS6のリリース日を予測したページが複数表示される。このケースは NeevaAIとGoogleどちらが適切か判断できない(後者の情報で満足する人もいそうだから)。
「PS8の入手が難しいのはなぜ?」と聞いたときの回答。まだ存在しないプロダクトなのに、PS5のことを答えてしまっている。こうした「存在しない事実や事柄について回答をしてしまう」ことは ChatGPTやNeevaAIを含めて検索にジェネレーティブAIを組み込むことの課題だと思う。
NeevaAI(や他の類似検索エンジンは)Googleの牙城を崩せるか
ChatGPTとSEOの話
Neevaの話をするまえにまずChatGPTの話から。昨年11月にOpenAIからChatGPTが公開されて以降、SEO業界はChatGPTの話題で持ちきりです。わたしが参加しているいくつかのフォーラムでも、ここ2ヶ月は ChatGPTの話題でスレッドが埋まっています。
検索領域におけるChatGPTの話題は、大きく分けて「コンテンツ生成」「業務効率化」「検索技術の進化」の3つのトピックで構成されています。それぞれについて見解を述べます。
ひとつ目。「コンテンツ生成をAIに任せる未来」は、現状は厳しいと思います。ChatGPTに実際にコンテンツを書かせてみた方はお気づきかと思いますが、トピックに対して「内容が浅すぎる」「文章として面白くない、執筆者の意図が存在しないので誰にも刺さらない」「それっぽいアウトプットを作るけど事実誤認やうそがまざっている」といった問題点があると思います。
わたしたちは、あるトピックについて情報を発信するとき、そこに(それがバイアスや誘導であっても)何らかの意図を持って特定のオーディエンスの理解や共感を得られるように文章を構成するものです。ChatGPTはそれがないからつまらないんです。
一般的な商品説明の冒頭文や定型文句であればAIに任せても問題ないんでしょうが、ひとに読んでもらうという観点でいうとChatGPTはまだほど遠いと思います。
「いやいや、Googleのためにコンテンツを用意したいんだからAIに作らせて十分でしょう?」と考えてしまった人は、そもそもコンテンツは人に読ませるためのものであり、オーディエンスとの関係性を構築するための手段であるという基本原則を思い出してみてください。
ふたつ目。「ChatGPTを使って業務を効率化する」は、もうちょっとだけ信頼性があれば〜という感じでしょうか。少なくともコンテンツをAIに生成させる未来よりは現実感があります。robots.txtや構造化データのマークアップなどを ChatGPTにクエリで投げると、それっぽいもの生成してくれます。ただ、よーく内容を確認すると意図したものでなかったり間違いが混ざっています。そのまま流用するのではなく、自分で内容を確認して正しく意図したものであると確認したうえで使うのであれば、ありだと思います。ただ、ChatGPTが生成した内容が正しいかどうかを判断する能力が利用者に求められます。
検索体験を大きく変える可能性を秘めるNeeva
最後(この記事の本題)にあげた「検索技術の進化」。個人的には革新的な技術の登場で従来の検索サービスモデルがどう変化するか非常に楽しみにしています。
全文テキスト検索の WebCrawler(1994年)から数えて約30年、インターネット検索エンジンは、インターネットのどこかに存在する情報ソースを探すものであり、検索結果に表示される10本の青いリンクから答えを探すものでした。現在でこそGoogleやBingは単純事実(天気、交通情報、スポーツ試合結果、言葉の意味など)のクエリにたいして最上部にリッチリザルトで直接検索結果に表示するようになったものの、複雑な検索に対しては依然として「答えになりそうな候補」を探すツールでしかありません。
一方、米Microsoftが昨年10月に発表した、ユーザーが入力したテキストから画像を生成する機能は、ネットに存在する画像を探してくるのではなくニーズにあったものを生成してしまうという点で画期的です(いろいろ問題もありそうですが)。NeevaAIも、背景や理由を尋ねる質問にたいして情報ソースを示しながら単一回答を表示するスタイルはわたしたちの検索体験を大きく変えることになるでしょう。
ChatGPTやNeevaAIの回答の正確性や信頼性がどこまで改善されるのかがカギとなります。もっとも現状のGoogle検索結果がそもそも信頼に値するのかという点も考慮しなければ公平ではありませんけれど。存在しない出来事やデマに対して「それは事実ではない、デマだ」と回答してくれるようになるのはまだ時間がかかりそうですよね。
検索エンジンの切り替えは負担が大きい
最後にしばらくNeevaを利用していて個人的に感じたこと。わたしは普段、Google検索に加えてGmail、YouTube、Googleカレンダーを日常的に利用しています。ニュースの確認は Microsoft Start と Googleニュースです。直近3年間はこのスタイルなのですが、ここで検索だけNeevaに切り替えるのは「習慣の変更」であり、心理的になかなか負担が重たいものだと感じました。たしかに Neevaが便利な場面もあるのですが汎用性という意味で Google検索がまだまだ先をいっていますのでGoogleを使いたい場面もあります。すると結局、目的にあわせて使い分けるより「とりあえずGoogleでいっか」となってしまいまがちです。
ちなみに本原稿を執筆するうえで事実確認(Neevaの創業日や創業者などのデータ)はNeevaAIで聞きながら整理しました。こうした業務用途ではNeevaAIは十分実用的です。無料アカウント(3ヶ月利用可能)もありますし、検索設定で「日本」を選択すれば日本語検索も利用出来ますので(NeevaAIは英語設定が必要)、興味ある方はぜひ試してみてください。
参考:AI生成コンテンツに対するGoogleの見解
But Danny Sullivan, Google’s public search liaison, says that more sophisticated writing tools that can suggest large chunks of text shouldn’t harm a page’s ranking if used to genuinely help web surfers. “If the primary purpose of the content is for users, it shouldn’t fall afoul of our guidelines,” he says. “If it’s the best and most helpful content, then ideally we would be showing it.”
(日本語訳)しかし、米GoogleのDanny Sullivan氏(検索担当パブリックリエゾン)は、大量のテキストを提案できるより洗練されたライティングツールは、純粋にウェブサーファーを助けるために使われるなら、ページのランキングに悪影響を与えることはないはずだと述べています。「コンテンツの主目的がユーザーのためであれば、ガイドラインに抵触することはないはずだ」「最高のコンテンツ、最も役に立つコンテンツであれば、それを表示するのが理想的である」と説明しています。
[Danny Sullivan, Google Public Search Liaison, "The Future of the Web Is Marketing Copy Generated by Algorithms", WIRED APR 18, 2022, https://www.wired.com/story/ai-generated-marketing-content/]
We haven't said AI content is bad. We've said, pretty clearly, content written primarily for search engines rather than humans is the issue. That's what we're focused on. If someone fires up 100 humans to write content just to rank, or fires up a spinner, or a AI, same issue...
(日本語訳)私たちは、AIコンテンツが悪いとは言っていません。私たちは、人間ではなく、主に検索エンジンのために書かれたコンテンツが問題であると、はっきりと言ってきました。私たちはそこに着目しています。もし誰かがランキングのためだけに100人の人間を雇ってコンテンツを書かせたり、スピナーやAIを使ったりしても、同じ問題です。
[Danny Sullivan, Google, Twitter, Nov 8 2022, https://twitter.com/dannysullivan/status/1589681355868504064]
We did talk about a focus on content *by people* for people in our post about improvements like the helpful content system. But the nuance is really that it's unlikely some AI content is going to feel written by people without some degree of human review:
(日本語訳)私たちは、ヘルプフルコンテンツシステムなどの改善に関する記事で、「人による人のためのコンテンツ」に焦点を当てることについてお話しました。しかし、そのニュアンスは、ある種のAIコンテンツが、ある程度の人の審査を通さずとも人間が書いたと感じられることはありえないということです。
[Danny Sullivan, Google, Twitter, Nov 8 2022, https://twitter.com/dannysullivan/status/1589681817300656131]
As said before when asked about AI, content created primarily for search engine rankings, however it is done, is against our guidance. If content is helpful & created for people first, that's not an issue.
(日本語訳)以前にもAIについて質問されたとき伝えましたが、主に検索エンジンのランキングのために作られたコンテンツは、それがどのようなものであっても、私たちのガイドラインに違反しています。もし、コンテンツが人の役に立つもの、人のために作られたものであれば、それは問題ではありません。
[Danny Sullivan, Google Search Liaison, Twitter, JAN 12 2023, https://twitter.com/searchliaison/status/1613462881248448512]
このたび、検索結果の評価を改善するために、E-A-T に E(経験)を追加しました。つまり、実際に製品を使用している、実際にその場所を訪問している、誰かが経験したことを伝えているなど、コンテンツにある程度の経験が織り込まれているかどうかも評価されます。状況によっては、そのトピックに関連して実体験をもつ人が作成したコンテンツが最も高く評価される場合もあります。
Now to better assess our results, E-A-T is gaining an E: experience. Does content also demonstrate that it was produced with some degree of experience, such as with actual use of a product, having actually visited a place or communicating what a person experienced? There are some situations where really what you value most is content produced by someone who has first-hand, life experience on the topic at hand.
[Google検索セントラル, 2022年12月15日、https://developers.google.com/search/blog/2022/12/google-raters-guidelines-e-e-a-t]
Then Sullivan references the revised E-E-A-T quality raters guidelines, saying, “For anyone who uses *any method* to generate a lot content primarily for search rankings, our core systems look at many signals to reward content clearly demonstrating E-E-A-T (experience, expertise, authoritativeness, and trustworthiness).”
(日本語訳)そしてダニー・サリバン氏(米Google検索担当パブリックリエゾン)は、改訂されたE-E-A-T品質評価者のガイドラインに言及し、「主に検索ランキングのために*あらゆる方法*で多くのコンテンツを生成する人に向けていうと、我々のコアシステムは多くのシグナルを参照し、E-E-A-T(経験、専門性、権威性、信頼性)を明確に示すコンテンツに報いている。」と述べています。
[Danny Sullivan, Google Search Liaison, Google search responds to BankRate, more brands using AI to write content, Search Engine Land, JAN 12 2023, https://searchengineland.com/google-search-on-using-ai-to-write-content-391728,
https://twitter.com/searchliaison/status/1613465456429633536]