【検索エンジン ランキング要因 2013年版】上位表示と最も相関関係が高いのはリンク、次いで+1 from #MozCon 2013

この記事では、僕が参加したMocCon 2013のセッションの1つをレポートします。

セッションテーマは、「検索エンジン ランキング要因 2013年版」です。

Moz独自の調査方法で、検索エンジンで上位表示しているページとサイトに見られる傾向を分析し、相関関係を導き出した結果です。

主要ポイントを説明します。

相関関係と因果関係は違う

本題に入る前に、相関関係と因果関係はイコールではないということを再確認しておきましょう。

この調査は上位表示ページ・サイトと各要因の相関関係を分析したものです。
相関関係が高かったからといって、それが必ずしも上位表示と因果関係がある、言い換えると上位表示の原因、理由になっているとは限りません。

たとえば、暑い日にコンビニで売れる商品を調べてみたらアイスクリームが普段より多く売れていたとしましょう。

このとき、「気温が上がるとアイスクリームの販売量が増える」という相関関係が見られたとします。

ところが、アイスクリームの販売量が増えることは気温が上がることの因果関係にはなっていません。

アイスクリームをたくさん売ったら気温が上がりますか?
ここ数年猛暑日が増えた理由は、コンビニでアイスクリームがたくさん売れたからですか?
そんなはずはありませんね。

・気温が上がる => アイスクリームが売れる

とはなるけれど

・アイスクリームが売れる => 気温が上がる

とは決してなりません。

一方で、「相関関係 = 因果関係」と判断できるケースもあります。

たとえば、肺がんで死亡する人を調べてみたら1日20本以上喫煙する人が多かったとします。

肺がんによる高い死亡率と喫煙量が多さに相関関係が見られたとします。
このとき、喫煙量が多いことは肺がんと因果関係がある、言い換えると喫煙は肺がんの原因になっているかといったら、おそらくなっていそうです(と、世間一般では言われている)。

例はあくまで例です。

ここであなたにしっかり理解してほしいことは、「相関性がある=因果関係がある」とは、他にも十分な調査データがないと断言できないということです。

SEOに置き換えると、上位表示しているサイトを分析したところ、◯◯の特徴が見られた、だから◯◯を施策すれば上位表示できる、とはまったく言えないということです。

そうかもしれないけれど、そうじゃないかもしれない。

そんな少数のデータの分析からではほとんど何も言えないということです。

そうはいっても、相関関係が因果関係を探る大きなヒントになる場合が多いこともまた確かです。

さて前置きが長くなりました。
本題に入りましょう。

検索エンジン ランキング要因 2013年版

リンク

ページレベルのリンク

  • Page Authorityにもっとも高い相関関係が見られた
  • Page Authorityが、リンクだけでなく今回のすべての調査項目のなかでいちばん高い相関関係を示した
  • リンクの多様性は依然として重要

【鈴木補足】
「Page Authority (PA)」とは、Moz独自の指標です。主にリンクのデータを基に算出されるスコアです。
相関関係と因果関係は違うとしても、やっぱりリンクは今でも強いということを表しているのかもしれません。

ドメインレベルのリンク

  • サブドメインに対するルートドメインからのリンクの数にもっとも高い相関関係がみられた

アンカーテキスト

  • キーワードに完全一致したアンカーテキストでのルートドメインへのリンクの数と、部分一致でのアンカーテキストでのルートドメインへのリンク数が、同じ数値でもっとも相関関係が高い
  • 内部リンクのアンカーテキストの相関関係は、外部リンクの相関関係に比べると著しく低い

【鈴木補足】
やっぱりアンカーテキスト?

サイトスピード

  • レスポンスタイムにはマイナスの相関関係があった
  • トータルのロードタイムには相関関係は見られなかった

【鈴木補足】
1つめは、表示スピードが遅いページはランキングが低かったということです。
また上位表示と表示速度には相関関係は見られなかったとしても、サイトの高速化は大切なことだともスピーカーは強調していました。

  • 表示に3秒以上かかると40%のユーザーはサイトを去る
  • 表示が1秒遅れるごとにコンバージョン率が7%ずつ下がる

オン・ページ(内的要因)

  • TF-IDFよりLM(Language Model)のほうがやや高い相関関係が見られた
  • titleタグとmeta descriptionタグ、h1タグに高い相関関係が見られた
  • Google+の著者情報には相関関係は見られなかった

【鈴木補足】
「TF-IDF」は、言葉があるかないかで内容を判断する仕組み、「LM」は結び付きの強い言葉を考慮する仕組みです(共起語みたいなもの)。
著者情報には相関関係は見られませんでした(むしろマイナスの相関関係、逆相関だった)が、検索結果でのCTRが上がるので設定すべきだとスピーカーはアドバイスしていました。

URL

  • EMD(完全一致ドメイン名)およびPMD(部分一致ドメイン名)には比較的高いランキングとの相関関係が見られる
  • EMDアップデートを堺に相関関係は下がりだした 2013年5月から再び上昇

ブランド

新たにできた、ブランドの言及に高い相関関係が見られた。

【鈴木補足】
いわゆるサイテーションです。
「新たにできた」は「言及」にかかります。「ブランド」ではありません。
ブランドのサイテーションが新たに生まれるということです。

ソーシャル

  • 相関関係は、+1、Facebook、Twitterの順
  • +1はPage Authorityに次いで全体のなかで2位

【鈴木補足】
「+1」が全体の中でも2番目に高い相関関係を示したというのが興味深いですね。
+1はランキング指標としては使っていないとGoogleのMatt Cutts氏は1ヶ月前にも発言していますがどうなのしょう。
もっとも因果関係にはなっていなくて、マイナーな+1が多く付くということは、それだけ良質なコンテンツなはずで、検索エンジンから見ても評価が高くまた被リンクが集まっているからかもしれません。

MozConでのセッションからのランキング要因最新版は以上です。

どれがいちばん気になったでしょうか?
納得がいく要因、納得がいかない要因はあったでしょうか?

僕のレポートは、ダイジェスト版のさらにダイジェスト版です。
より詳細にわたる分析をMozのブログで夏後半に公開するとのことです。