Googleが取得した特許、「Information retrieval based on historical data」の解説を続けます。
「時間」という概念を取り入れて、リンクのFreshness(新しさ)を評価項目に取り入れるということを2回目で、説明しました。
「時間」とは別に、リンクを含むウェブページが持つ「Trust(トラスト:信頼)」と「Authority(オーソリティ:権威)」もリンクの評価に関係してくることが、特許で述べられています。
…links may be weighted based on how much the documents containing the links are trusted (e.g., government documents can be given high trust). Links may also, or alternatively, be weighted based on how authoritative the documents containing the links are (e.g., authoritative documents may be determined in a manner similar to that described in U.S. Pat. No. 6,285,999).
TrustとAuthority、同じような意味で使いがちですが、このくだりを読むと、GoogleではTrustとAuthorityを区別しているようです。
WebmasterWorldのフォーラムアドミニストレータ、tedster氏が、彼なりの見解をまとめています。
Googleが取得している別の特許から判断すると、Authorityはバックリンクによって蓄積されます。
つまりバックリンクが多ければ多いほど、サイトのAuthorityは高まります。
一方、政府系のドキュメントやAmazon.comが、Trustが高い例として挙げれています。
トラフィックの多いサイトも含まれるようです。
またtedster氏は、DMOZや、.govドメインもTrustedサイトだろうと推測しています。
ここからは、tedster氏の興味深い分析です。
Googleは、Trustをリンクを通して、繋がっているサイトに受け渡していきます。
どのサイトを、最初にTrustedサイトとして認定するかは手動で選定するようです。
最善なのは、当然Trustedサイトとして認定されること。
次は、Trustedサイトから直接リンクをもらうこと。
その次は、Trustedサイトからリンクをもらったサイトからリンクをもらうこと。
このように、Trustedサイトからのリンクの経由数が少なければ少ないほど、引き継がれるTrustの度合いは強くなります。
tedster氏は、このような状態を「seed(種、子孫)」という言葉で表現しています。
「本人⇒子供⇒孫⇒ひ孫⇒・・・」、と世代が移るにつれて“血が薄く”なっていくという感じですね。
Googleは、TrustRankという指標もアルゴリズムにく見込んでいると言われていて、上で説明したことが基盤になっていると考えられます。
Authorityは、被リンクによって増すことができます。
対してTrustは、Trustedサイトからのより近いリンクによって増すことができます。
このほかにも、違いがあるようです。
Authorityは、ウェブページに対して与えられますが、Trustは、ドメインに対して与えられます。
また、Trustは、Authoriyに比べると検索順位を上げる要因としては、効果が低いようです。
Trustは、ランキングに影響を与えるよりも、ドメインの信頼度を高め、Google Bowlingのような悪意のある攻撃から自分のサイトを守り、ランキングを保つのに役立ちます。
気になるのは、seedの始まり、つまりGoogleに”Trusted”として認定されたドメインがどのドメインなのか、ですね。
今のところ公表されていないし、今後も公表されないだろうということで、推測するしかなさそうです。