最適化していないキーワードで上位表示するのは“Topic-Sensitive PageRank”と“共起語”が理由か?

[対象: 上級]

PageRankやアンカーテキストを今のGoogleはどのように評価しているかが今日の記事のテーマです。

2週間ほど前に、「共起サイテーション」がアンカーテキストに取って代わるランキング指標になってきているかもしれないという話をしました。
これは、SEOmozのRand Fishkin(ランド・フィッシュキン)氏による予測を紹介したものです。

この1週間後には、「共起サイテーション」が評価され始めアンカーテキストの効果が落ちたということではなく共起語のアンカーテキストが重みを増しているのではないかというSEO by the SeaのBill Slawsiki(ビル・スロースキ)氏によるFishkin氏の予測に対しての異論記事を紹介しました。

そして今日取り上げるのは、総仕上げとも言うべき、iAcquireブログでのJoshua Giardino(ジョシュア・ジャルディーノ)氏による共起サイテーションとアンカーテキスト、PageRankの分析・考察になります。

titleタグやアンカーテキストに含まれていないなど最適化されているとは思えないキーワードで上位表示するサイトが存在することの理由に繋がりそうです。

非常に長い記事なので主要ポイントをまとめます。

考えられるPageRankとアンカーテキストの現在のGoogleの評価の仕方

  • アンカーテキストの効力が落ちたわけではなくアンカーテキストの評価方法が変わってきた。
  • Co-occurrenceの分析とTopical PageRankの採用によりコンテキスト(文脈、前後関係)に関連性のあるリンクがより高く評価される。
  • 逆に関連性のないリンクは評価が低くなりときにはマイナスな評価を与えられることがある。
  • Fishkin氏が共起サイテーションで予測したような、エンティティとサイテーションを結びつけてランキングに反映させているわけではない。
  • 文字列に対してではなくものごと(エンティティ)に対してPageRankをGoogleは算出している。
  • こういったことがペンギン・アップデートで用いられている可能性もある。

「関連性のあるリンクが評価される」なんていうことは今に始まったわけでなくてもう何年も前から言われていることですね。

でもどうやって関連性を判断しているのか?、関連性が高いとはどういう状態なのか?という質問に明確に答えられる人はいないはずです。
もしいたとしても、それはその人がウェブ上の0.1%にも満たないようなごくごくほんの一部の事例だけを分析して(分析したつもりになって)言っているだけです。

Googleは、“Co-occurrence”(僕たちが言うところの「共起語」)と“Topical PageRank”の採用によって、そのリンクのアンカーテキストがコンテキストに関連しているかどうかを判断できるようになってきたのではないか、というのがGiardino氏の考えです。

共起語を分析すれば、完全に一致したキーワードでのアンカーテキストテキストでなくても同一性や関連性を判断することができます。
共起語をGoogleが知る手がかりにしているフレーズベースインデックスは同義語の理解にも一役買っています。

“Topical PageRank”は、僕のブログでは初めて出てきた用語です。

どんなものか簡単に補足しておきます。

正しい名称は“Topic-Sensitive PageRank”(トピック・センシティブ ページランク)になります。

Topic-Sensitive PageRank

“Topic-Sensitive PageRank”は、米スタンフォード大学のComputer Science DepartmentのTaher H. Haveliwalaが考案した理論です。

ひとことで言えば、PageRankの算出に“トピック”を反映させる仕組みです。
トピックは、テーマとか内容とかそのドキュメントが取り扱っているものと考えてください。

オリジナルのPageRankはリンクだけを考慮したものでリンク元ページとリンク先ページのトピックの関連性は含まれていません。

これに対してTopic-Sensitive PageRankはトピックを考慮に入れます。
検索結果にqueryやquery contextを反映させるのです。

“イメージ的には”次のようになります。

たとえば、オリーブオイルに関するページにリンクするとします。
カルボナーラのレシピを説明したページからのリンクのほうが新聞配達のアルバイト体験を綴ったページからのリンクよりも価値が高いということです。
反対に新聞配達のアルバイト体験ページからのリンクは評価を下げられるかもしれません。

Topic-Sensitive PageRankについて詳しく知りたければ論文を読んでください。
Topic Sensitive PageRank – Taher H. Haveliwala, Stanford University

こちらはスライドです。
Slides of Topic Sensitive PageRank

もっとも論文はあくまでも論文でこれが実際にアルゴリズムとして実装されているかどうかは別問題です。
机上の空論にしか過ぎないと言うことだってできます。

ただしコンピュータ能力の進歩とGoogleの技術力の向上により数年前までは実現が不可能だったことが今は可能になっていたとしてもなんら不思議なことではありません。

Topic Sensitive PageRankがすでにアルゴリズムに組み込こまれ稼働していることが現実になっていそうなのです。

そうはいっても膨大なコンピュータパワーを使用し処理に長い時間がかかるから、ペンギン・アップデートはオフラインのプロセスになっているのかもしれませんね(と、これは僕の推測)。

再度まとめ

最初に書いたことと同じですがもう一度まとめます。

  • PageRankとアンカーテキスト、言い換えればリンクは今でも最重要なランキング要因である。
  • しかしすべてのリンクのPageRankとアンカーテキストは同じようには評価されていない。
  • Co-occurenceとTopic-Sensitive PageRankにより、関連性を反映したリンクの重み付けが可能になっている。
  • 結果として、完全にあるいは部分的に一致したアンカーテキストでなくても異なるキーワード(クエリ)に対して高い評価が与えられることがある。
  • 反対に、関連性がないとみなされたリンクは評価が低くなるしスパムとしてマイナス評価を受けることもある。

あなたがすべきこと

で、ボク・ワタシはどうしたらいいの? という疑問が出てくるかもしれません。

僕からのアドバイスです。

ガイドラインを守ってSEOを施策するサイト管理者と人工リンク・有料リンクの力を借りてサイト運営する人に向けての2パターンがあります。

ガイドラインを守ってSEOをやる人へ

この記事を読んだからといって特別に今までのスタイルを変えることはありません。
ユーザーの役に立つコンテンツをこれからも作り続けてください。

自分で書いた記事を否定するようですが、ここまで書いてきたことやPageRankのこと、アンカーテキストのことなんて気にする必要はありません。

共起語の分析は僕たちには難しいことです。
仮に分析できたとしてそれがGoogleが認識している共起語だという保証はまったくありません。
共起語は日々変化します。
それにGoogleは共起する言葉を予測していることだって考えられます。

Topic-Sensitive PageRankの論文にはランキングの類似性を評価するための関数なんかも載っていますが、凡人には高度すぎて理解できません。
理解できたとしても関連性を解き明かすことなんてとうてい無理です。

感覚的、直感的に関連があるないは判断できたとしても、Googleはすべて数学的に関連性を導き出していることは明らかです。
titleタグやhタグにキーワードが入っているかどうか本文の初めにキーワードがあるかなんて、そんな単純なものであるはずがありません。

解のない問いに取り組むよりも、ユーザーの役に立つコンテンツ作りに励みましょう。
ユーザーの役に立つコンテンツを作ることができれば、共起語だって自然と入り込んでくるだろうし関連するページからのリンクも入ってきます。
共起語もTopic-Sensitive PageRankも本来の利用目的はユーザーに対して最適な結果を返すためですからね。

下の記事も一度読み返しておくと役に立つでしょう。

人工リンク・有料リンクに頼る人

好むと好まざるとにかかわらずまたどんな理由があるにせよ人工リンクや有料リンクの力を借りることを選択する人もいますね。

もし、こちらのグループにあなたが属するなら今日の記事で取り上げた、iAcquireブログの記事をゼッタイに最初から最後まで読みとおすことを強く推奨します。

英語でしかもかなりの文量ですがあなたが知っておくべきたくさんの情報が具体的な事例も交えて詳しく解説されています。
読まかったとしたら大きな損をしそうな予感が僕にはします。
英語が苦手ならお金を払ってでも誰か(最適なのはSEOに精通した、英語ができる人)に訳してもらうべきかもしれません。

書かれていることをきちんと理解できれば、自分がこれから進むべき方向性について大きなヒントを得られるはすです。
知らない状態では大きなリスクを抱えたまま危うい道を進むことになるんじゃないでしょうかね。

また、iAcquireブログの記事が書かれるきっかけになったSEOmozのRand Fishkin氏とSEO by the SeaのBill Slawsiki氏の記事も併せて読むとさらにいいでしょう。

健闘を祈ります。