特許から判断する検索エンジンのアルゴリズム要素×26

検索エンジン会社が申請・取得した特許・論文を細かく分析して情報を公開することで有名なSEO By The Seaというブログがあります。
サイトオーナーはBill Slawski(ビル・スラウスキ/スロースキ)氏という人物で、Patent Guru(特許の達人)とも呼ばれています。

彼が最近受けたインタビューのなかで、特許の研究から読み解いた検索エンジンがランキングを決める際に考慮していると思われるアルゴリズムの要素をリストアップしていたので紹介します。

まずアルゴリズム要素を3つのタイプに分類しています。

  1. リンクに基づく要素
  2. コンテンツに基づく要素
  3. ユーザーの行動に基づく要素

それぞれに具体的にどんな要素があるのか訳します。

1. リンクに基づく要素

リンクの数と重要性以外に次のような要素が考えられる。

  • リンクの年齢
  • リンクの増減の頻度
  • リンク切れやリダイレクトリンクの数
  • リンクのアンカーテキスト
  • アンカーテキストで使われる関連用語(”関連”性は、そのページが検索されるときに利用される検索キーワードにどのくらい一緒に含まれるかによって決まる。)
  • リンク元サイトのジャンル(ブログだとかニュースサイトだとか一般のウェブサイトだとか)
  • リンク元のドメインの年齢
  • ある検索キーワードで上位に表示されるサイトからのリンク数

2. コンテンツに基づく要素

ページにワード(単語・語句)が含まれていること以外に次のような要素が考えられる。

  • ページレイアウトの中でワードがどこに出現するか
  • HTMLでワードがどのようにフォーマットされているか
  • リーディング レベル スコア(ごめんなさい、日本語の意味が分かりません。元のフレーズは”a reading level score for a page”です。)
  • 綴り(つづり)・文法・文の構成
  • 関連する単語や語句が同じページに出現するか(”関連”性は、他のウェブページの検索にどのくらい頻繁にそのキーワードが一緒に使われるかで判断される。)
  • 特定の人物や場所、物事に関する事実がどのように構成・表現されているか
  • 新しい出来事の新鮮度
  • ページに存在する画像に関してどんな種類の特徴やメタ情報があるか
  • ページやサイトのコンテンツの更新頻度

サーチエンジンが分析するコンテンツはより細分化したレベルにフォーカスするようになってきていて、ページの個々のセグメント(ヘッダーとかサイドバーとかメインコンテンツ部分とか)を見るようになってきている。
また反対に、サイト全体あるいは相互に関連しているサイトに対してそのページのコンテンツがどのくらい関連性があるかを拡大してみるようにもなっている。

3. ユーザーの行動に基づく要素

特定の検索によるSERPでのクリック率や一連の検索セッションで複数のページに訪問すること以外に次のような要素が考えられる。

  • 検索のやりなおし(キーワードを足したり別のキーワードで検索しなおすこと)
  • ブックマーク登録
  • タグ付け
  • 閲覧履歴。どのくらい滞在したかやどこまでスクロールしたか、どこにマウスポインタを動かしたかも含む。
  • アラートの選択と使用(”alerts”ってGoogleアラートとかのことでしょうか?)
  • RSSフィードの購読
  • 地図検索やニュース検索、画像検索のようなバーティカルサーチの検索活動
  • 商品やサービスを提供するビジネスのランキングや評価
  • レビューの評判分析

以上が特許に書かれている内容を元にBill Slawskiが分析したアルゴリズム要素になります。
すべてがすべて実装されているわけではないでしょうし、僕たちが自分でコントロールできるものできないものがあります。
それでも、SEOの施策に参考になるヒントが詰まっているのではないでしょうか。