僕たち、SEOに取り組むウェブマスターにとって、GoogleやYahoo!といった検索サービスの内側というのは常に気になるものです。
しかしながら、検索アルゴリズムは企業秘密だし、乱用を防ぐ目的もあり、公表されることはまずありません。
そうは言っても、完全な秘密主義もよろしくないということで、GoogleのSearch Quality teamのVice President、Udi Manber氏が、Googleの公式ブログで、検索品質について情報公開してくれました。
個人的に興味を持った部分を解説します。
◆◆◆
Google検索が唯一無二、目指すところは、「ユーザーの検索性向上」です。
それ以外の何者でもありません。
検索の品質(サーチクオリティ)は、1つの部門ではなく複数の部門に渡って開発されています。
Googleの中に、Search Qualityというセクションがあり、その中にランキングのアルゴリズムを開発するグループ、ユーザーインターフェイスを開発するグループ、ウェブスパム対策を行うグループなどがあります。
有名なMatt Cutts氏は、Webspam teamの長です。
検索順位を決めるのは非常に難しいことです。
理由のひとつは、言葉そのものの曖昧さに加えて、文章には決まった形でのルールが存在しないからです。
そして、検索キーワードからだけで検索者の意図を正確に知ることは難しいためです。
特に、2語以下の検索については。
したがって、ウェブ上のすべてのドキュメントを把握して、検索者の求めるものを正確に推測することが重要になります。
ランキングにかかわる指標でもっとも有名なのがPageRankです。
PageRankは、今でもアルゴリズムとして使われてますが、大規模な仕組みの中の一部分にしかすぎません。
ランキングには、慣用句・同意語・スペルミスといった言語的要素や、キーワードをどのような意味で使っているのかという意図的要素、その瞬間にいちばん適した情報は何かという時間的要素、個々の検索者にとって最適な結果を出すパーソナライズ的要素、なども加味されます。
自動で、常に検索結果に対する評価が行われていて、定期的に全体的なチェックも実行されています。
特定のアルゴリズムに関しても、チェックしています。
2007年には、450個のアルゴリズムが開発・改良されました。
平均して、1週間に9個の割合になります。
1月には、重要なPageRankの更新をしました。
◆◆◆
なんだか、あまり上手にまとめられませんでした。(笑)
他には、少数派の言語への対応取り組みや、ユニバーサルサーチが例に挙げられるユーザーインターフェイスの開発、Webspam対策チームの紹介などについても、書かれています。
検索アルゴリズムは、「Crown Jewel(宝石で装飾された王冠)」ということで、核心までは言及していませんが、今後も続けて情報を公開していくと、Udi Manber氏はコメントしています。
次回は、もうちょっと突っ込んだ部分にも迫ってほしいですね。