Yahoo!MSNGoogleSEMSEOペイドリスティングアドワーズOvertureニュースショッピング検索市場分析お知らせ

Amazon.com、書籍全文検索サービスをどのように構築したか


2003年10月27日 20:07 | TrackBack (3) | [ショッピング検索]

米Amazon.com が書籍の文章を対象とする全文検索サービスを開始しましたが、どうやって12万冊以上の書籍全文をデータに取り込んできたのか気になった方はいませんか?

USA Today 誌にAmazon.comの書籍情報のデジタル化の過程についての説明がありました。3,300万ものページを全部スキャンしてイメージ化して保存、その上で検索エンジンで参照・アクセス可能なテキストに変化したのですね。10年前には実現不可能だったそうで。


It took a bold stroke for Amazon, the world's largest online retailer, to make the new service available. First, it had to scan 33 million book pages into an image archive, in some cases manually tearing pages from bindings to run through a scanner, in others, shipping caches of books to scanning centers in India and the Philippines.

Udi Manber, Amazon's vice president of search algorithms, then used processing power borrowed from the company's backup computers to convert the images into text data that could be cross-referenced and accessed by a custom-built search engine. "Ten years ago, this was all science fiction," says Manber.

[Source]
Amazon opens pages to perusal [USA TODAY / Posted 10/26/2003 10:35 PM]

[関連]

Amazon.com、全文検索サービス"Search Inside the Book" を導入

Google、書籍全文検索サービスの構築に着手


この記事へのトラックバックURL:





最新の検索エンジン業界ニュース

URL変更: http://www.sem-r.com/
ディズニー公式サイトにアスクジーブスの検索ボックス設置
アスクジーブスジャパンBlog
Yahoo!ダイジェストページがSERPsから消える?
Jリスティング、社長ブログ「MBAキーワード広告社長日記」を開設
ショッピング検索 Brilliant Shopper、ベータ版を公開
Mooter日本語版が登場





検索市場分析 | お知らせ | コンテンツターゲティング広告 | ポータル / ディレクトリ | Google 2003 | Google 2004 [I] | Google 2005 [I] | AdSense / アドセンス | AdWords / アドワーズ広告 | Froogle / フルーグル | ローカル検索 | モバイル検索 | MSNサーチ | Overture / オーバーチュア | PFI - ペイドインクルージョン | ショッピング検索 | ペイドリスティング(PPC) | 検索エンジンニュース 2004 [I] | 検索エンジンニュース - 2003 | 検索エンジンニュース 2004 [II] | 検索エンジンマーケティング SEM | SEO - 検索エンジン最適化 | SEO書籍 / ブックレビュー | SEM/SEOセミナー | 検索エンジンニュース 05Q1 | 検索エンジンニュース 05Q2 | SEO / 検索 統計 | Yahoo! / ヤフー |

関連サイト - SEMリサーチ | Yahoo!サーチSEM | SEO対策FAQ | SEM PR | Yahoo!サーチ weblog | MSNサーチ blog | iREP SEMサービスサイト

運営者 - | 『検索にガンガンヒットするホームページの作り方』





COPYRIGHT © 1997-2005 Takahiro Watanabe 渡辺隆広 ALL RIGHTS RESERVED.(寄稿記事を除く)
- 検索エンジンマーケティング業界ニュース- xml RSS Feed