MSNサーチ、6/25に正式リリース
CNET JAPANによるとマイクロソフトは6月24日にウェブサイトやPC内を横断的に検索できる「MSNサーチ ツールバー with Windows デスクトップ サーチ」(MSNサーチ ツールバー)の日本語版をリリースし、さらに翌25日に同社が独自開発した検索エンジンの正式版を提供することを明らかにした。
WindowsデスクトップサーチはWindows OSに標準搭載されている検索機能を拡張し、ローカルPC上に保存されているファイルをキーワードで検索できるソフト。MS Office文書やMP3、GIF、JPEG、Adobe PDFファイルなどが検索できる。Windowsデスクトップサーチは英語版で既に日本語ファイルが検索できたが日本語版公開によりインターフェースも日本語となる。同ツールはMSNサーチツールバーと共に配布される。
そのMSNサーチツールバーには新たにタブブラウジング機能を追加。同じ1つのウインドウ内に複数のウェブサイトを表示できるようになる。
一方6月25日からはMSNサーチの日本語版が正式稼動する。MSNサーチは現在米Yahoo!子会社Inktomiの検索エンジンを採用しているが、自社開発の検索エンジンに切り替える。MSNサーチは6月20日にNetRankやNeural Netなどの技術を取り入れて検索性能を改善するなど準備を整えていた。MSNサーチでは従来のWeb検索や辞書検索のほか、エンカルタ百科事典から検索することも可能になる。
MSNサーチは米国では2005年2月1日より正式提供され、Windows Desktop Searchも5月15日に正式リリースしていた。遅れること4ヶ月、ようやく日本語版が披露されることになった。
MSN、ついに新たな日本語検索エンジンへ切り替え--デスクトップ検索も正式版に
[CNET]
http://japan.cnet.com/news/media/story/0,2000047715,20084684,00.htm
cf.
MSNサーチ ツールバー with Windows デスクトップ サーチ
http://desktop.msn.co.jp/
テクノラティジャパン、サイトをリニューアル
![]()
テクノラティジャパンが2005年6月23日、Technorati.jpサイトをリニューアルした。先日の米Technoratiのリニューアルにならったデザインに変わった。ブログ内で注目されているCD、DVD、ゲームのランキングを表示するトップCD、トップDVD、トップゲームの3コンテンツが新たに追加された。
テクノラティジャパン
http://www.technorati.jp/home.html

cf.
テクノラティジャパンブログ
http://trj.weblogs.jp/blog/
【SEMセミナー】「成功するオーバーチュア活用術」
株式会社アイレップにて2005年6月29日(水)にSEMセミナー¥『「成功するオーバーチュア活用術」 〜本当に効率的な運用が実現できていますか?〜』を開催します。今回はオーバーチュア株式会社より西村多聞氏に、スポンサードサーチをどのように利用すればよいのかを成功事例、業種別の傾向に触れながらご講演頂きます。
定員は80名、参加費は無料です。
SEMセミナーの詳細を見る
* * * * * *
■■■
■■■ 「成功するオーバーチュア活用術」セミナー(無料/80名様限定)
■■■
13:30〜
【ご挨拶】
株式会社アイレップ 取締役 葛原豊
13:40〜
【スポンサードサーチの活用と成功事例】
オーバーチュア株式会社 西村多聞氏
14:50〜
【スポンサードサーチで実戦するブランド広告】
SEM総合研究所所長 渡辺隆広
15:25〜
【貴社の運用はいま何点?】
株式会社アイレップ
SEMインテグレーショングループ シニアマネージャー 紺野俊介
15:55〜
【質疑応答など】
◎日時 2005年6月29日(水)13:30-16:15(13:00受付開始、16:15終了予定)
◎会場 住友新橋ビル 9F
(東京都港区新橋1-8-3)
◎定員 80名(応募数多数の場合は抽選とさせていただきます)
◎参加費 無料
MSNの"RankNet"(ランクネット)
MSN Search's WebLogにて記述が少し変更され、MSN Searchに関連する技術として"RankNet"(ランクネット)があることが明示されました。RankNetについてはChris Burges氏の論文"Learning to Rank using Gradient Descent"に記載がありましたが、RankNetに関連するMicrosoftの特許が2つありました。
1つは"System and method for identifying content and managing information corresponding to objects in a signal"。もう1つが"Method for scanning, analyzing and handling various kinds of digital information content"。
An "interactive signal analyzer" provides a framework for sampling one or more signals, such as, for example, one or more channels across the entire FM radio spectrum in one or more geographic regions, to identify objects of interest within the signal content and associate attributes with that content. The interactive signal analyzer uses a signal fingerprint extraction algorithm, i.e., a "fingerprint engine," for deriving traces from segments of one or more signals. These traces are referred to as "fingerprints" since they are used to uniquely identify the signal segments from which they are derived. These fingerprints are then used for comparison to a database of fingerprints of known objects of interest. Information describing the identified content and associated object attributes is then provided in an interactive user database for viewing and interacting with information resulting from the comparison of the fingerprints to the database. [Herley, Cormac; (Bellevue, WA) ; Burges, Chris; (Bellevue, WA) ; Renshaw, Erin; (Kirkland, WA), Abstract, "System and method for identifying content and managing information corresponding to objects in a signal"]
Computer-implemented methods are described for, first, characterizing a specific category of information content--pornography, for example--and then accurately identifying instances of that category of content within a real-time media stream, such as a web page, e-mail or other digital dataset. This content-recognition technology enables a new class of highly scalable applications to manage such content, including filtering, classifying, prioritizing, tracking, etc. An illustrative application of the invention is a software product for use in conjunction with web-browser client software for screening access to web pages that contain pornography or other potentially harmful or offensive content. A target attribute set of regular expression, such as natural language words and/or phrases, is formed by statistical analysis of a number of samples of datasets characterized as "containing," and another set of samples characterized as "not containing," the selected category of information content. This list of expressions is refined by applying correlation analysis to the samples or "training data." Neural-network feed-forward techniques are then applied, again using a substantial training dataset, for adaptively assigning relative weights to each of the expressions in the target attribute set, thereby forming an awaited list that is highly predictive of the information content category of interest. [Russell-Falla, Adrian Peter; (Portland, OR) ; Hanson, Andrew Bard; (Portland, OR), " Method for scanning, analyzing and handling various kinds of digital information content"]
MSNの"Neural Network Technology" - ニューラルネットワークテクノロジ
米Microsoftは今回のMSNサーチの検索性能の強化において、Neural Network Technology(ニューラル・ネットワーク・テクノロジー)と呼ぶランキングシステムを紹介しています。この、Neural Network Technologyですが、Microsoft ResearchのChris Burges氏が書いた論文"Learning to Rank using Gradient Descent"にRankNetという呼称で記述されています。
We have proposed a probabilistic cost for training systems to learn ranking functions using pairs of training examples. The approach can be used for any differentiable function; we explored using a neural network formulation, RankNet. RankNet is simple to train and gives excellent performance on a real world ranking problem with large amounts of data. Comparing the linear RankNet with other linear systems clearly demonstrates the benefit of using our pair-based cost function together with gradient descent; the two layer net gives further improvement. For future work it will be interesting to investigate extending the approach to using other machine learning methods for the ranking function; however evaluation speed and simplicity is a critical constraint for such systems.
適切な検索結果を表示するために、どの文書が何の検索クエリと関連性があるかを学習させていく方法があるのですがMSNではNeural Networkを用いてこれを達成しようとしています。Neural Network(ニューラルネットワーク、神経回路網)とは人間の脳の構造をまねて作った情報処理の方法です。このニューロンを用いて検索クエリと文書の関連性を学習させていくことで、検索の関連性が高まっていくのです。
cf.
Microsoft、MSN Searchの検索能力を大幅に強化
おまけ動画
ジャックのボールキャッチジャックラッセルテリアのジャックをもっと見たい人はジャックさんの成長日記へGO!
お風呂に入るジャック
ジャックの「キャッチボール」や「待て」「ダッシュ」の動画もあります→ジャックの成長日記