2007/10/18 木曜日20:28:36 マイクロソフト、Live Search日本語版のアップデートについて説明
- マイクロソフト、Live Search日本語版のアップデートについて説明
- 「SEM R」より引用
マイクロソフトは2007年10月17日、今秋実施した検索サービスLive Searchのアップデートや日本語版の状況に関する説明会を開催した。
Live Search日本語版は主にコア検索技術のクオリティー向上に着手。Live Searchが採用するランキングシステムRankNetの日本向けリモデリングを実施した。
http://www.sem-r.com/6/20071018212404.htmlとは、ニューラルネット技術を利用した機械学習アルゴリズム(machine learning algorithm)。検索結果のトレーニングデータ(サンプル)で学習させることで、適切なランキングを決定するためにウェブページのどの要素に評価のウエイトをおくべきかを決定する。例えば静的ランキング(static ranking)システムの代表であるPageRankは、単純にリンクの数や質を利用してウェブページのスコアを算出するため、検索エンジンスパマーに操作されやすい欠点がある。一方RankNetは複雑な項目を評価するため操作がされにくいほか、学習の結果、使用に適さなくなった要素は最終スコア算出時に評価対象から排除することができる。
日本語版の検索品質改善は、10月2日時点で行われた。隠しテキストやキーワード繰り返し、リンクファームによるスパムといった古典的なスパムの排除に成功しているほか、一部のパターン化されたリンク(例えば有料リンク)のウエイトを低下させる一方、形態素解析などの日本語処理にも手を加えたことで、以前よりも検索品質は改善されたことが確認されている。今回の発表でも同社は「検索結果10件以下が従来の半数」「インデックスサイズを4倍」「プラットフォームの改善」「クローリングアルゴリズム改善によるより広く、深くインデックス」「単語の区切りミス33%減少」などの改善を挙げていた。
…

カテゴリ:
関連キーワード:
関連するニュース:

