グーグルの特許に見るリンクと時間の関係(1)

“Information retrieval based on historical data”というGoogleが取得した有名なパテント(特許)があります。

時間の経過を基にした情報取得に関する仕組みを解説したものです。

このパテントが、Sandboxドメインエイジの仕組みを探る手がかりにもなっています。

2005年に取得されましたが、2008年の3月に更新版がUSPTO(The United States Patent and Trademark Office:米国特許商標庁)によって認可されました。
2008 Information retrieval based on historical data

Googleがどんふうにして時間軸をアルゴリズムに組み込もうとしているのかを、うかがい知ることができる非常に興味深い文書です。

特許なのですべてが実装されているとは限りませんが、きっと参考になるはずなので、数回にわたって解説していこうと思います。

いくつかの項目があり、さしあたり「Link-Based Criteria」というリンクの時間軸に関するセクションを取り上げます。

反応があって、かつ余力があれば、別のセクションも検討します。w


Googleが、リンクに基づいてウェブページを評価しているのは、今さら言うまでもありません。

リンクをベースとした要素は、リンクが新しく出現した時、あるいはリンクが消滅した時に関係します。

リンクが新しく出現するというのは、リンクを含んだウェブページが出現した時、もしくは既存のウェブページにリンクが追加された時を指します。

一方、リンクの消滅は、リンクが削除されたとき、あるいはリンクを含んだウェブページそのものがなくなった時をさします。

リンクの出現や消滅は、サーチエンジンがクロール、インデックスした時に起源を発します。

サーチエンジンは一定の期間の中で、いつリンクが出現して消滅したかや、どんな割合でリンクが現れたり消えたりしたかを監視します。

時間軸を考慮にいれてウェブページを評価し、たとえば新しいリンクの数や増加率が下降する傾向にあるなら、そのウェブページは「古い(Stale)」情報になってきたと判断し評価を下げます。
※「Stale」は、「古くさい、時代にそぐわない」というニュアンス

反対に、上昇傾向にあるなら「新しい(Fresh)」情報だとして、状況によっては、より関連性があるとみなします。
※「Fresh」は、「新鮮な、今にふさわしい」というニュアンス

このように、ウェブページが「Fresh」なのか「Stale」なのかを、時間の経過とともに推移する被リンクの付き具合によっても判断するのです。

リンクの付き具合が下がると、ウェブページがもう更新されなくなったとか、重要でなくなったとか、別のページに取って代わられたなどとして、「Stale」になったとみなされます。


今日は、時間という概念を取り入れたリンクの増加/減少によって判断されるウェブページの評価について説明しました。

ここからは僕なりの解釈です。
間違っていると感じたら、ツッコミをお願いします。w

ウェブページが新しいか古いかは、ページのタイムスタンプ(更新日)だけではなく、被リンクでも決めているようです。

リンクが付くペースが落ちてくれば、もっと言えばリンクが付かなくなったら、そのウェブページは古い情報しか提供していないと判断されます。

ここでいう「古い」というのは「歴史がある」という意味ではなく、「時代遅れの」という意味です。

たとえば、今年の11月に「日本シリーズ優勝チーム」というキーワードで検索したとしましょう。
検索結果の1位に、10年前の日本シリーズ優勝チームについて書かれたページが表示されたら、困惑しますよね。
(10年前の1998年は、「横浜ベイスターズ vs. 西部ライオンズ」で、ベイスターズの優勝でした)

かといって、10年前の日本シリーズについてのページが、内容が薄いというわけではありません。
単に、今にそぐわない、つまりFreshではないというだけの話です。

こう考えると、リンクは常に増え続けていくのが、安定した上位表示に欠かせない要素になりそうです。

もちろん、継続してナチュラルリンクが集まるコンテンツを作成するか、それとも自分でリンクを送り続けるかは、あなたの戦略次第です。