ウェブマスターツールの「検索クエリ」がGoogleアナリティクスのデータと異なる理由

[対象: 中〜上級]

Googleウェブマスターツールの「検索クエリ」と他のアクセス解析ツール、とりわけGoogleアナリティクスのデータにどうして違いが生まれるのかをこの記事では解説します。

検索クエリが改善され、概数ではなく実数値をレポートするようになりました。
しかし依然として、Googleアナリティクスのデータと大きな違いがある指摘する声があります。

完全に一致することはないにせよ、気になるほどの開きが生じるのはどうしてなのでしょうか?

検索クエリのヘルプとGoogleの人から直接受けた説明などをもとにすると、以下の理由が考えられます。

  • ソースデータ
  • 対象となる検索のタイプ
  • 計測方法
  • セッションの管理
  • JavaScriptの有効・無効
  • タイムゾーン
  • 反映時間
  • Googleアナリティクスの参照元の特殊な処理

順に解説します。

なおこの記事の作成にあたっては、木村將さんの援助も受けました。
木村さん、ありがとう!

ソースデータ

そもそも、素となるデータが異なります。

ウェブマスターツールの検索クエリはGoogleアナリティクスが取得したデータを利用しているわけではありませんね。
逆も然りです。

検索クエリは検索クエリの、GoogleアナリティクスはGoogleアナリティクスのデータを使っています。

アクセス解析専用のツールであっても、GoogleアナリティクスとSiteCatalystのようにプロダクトが違えばデータには必ず差異が発生します。
Webビーコン型の解析ツールとサーバーログ型の解析ツールも異なるのが当たり前です。

対象となる検索のタイプ

ウェブマスターツールではデフォルトで「ウェブ」でフィルタされています。
つまり画像検索やモバイル検索などウェブ検索以外からのトラフィックが除外されています。

検索クエリはデフォルトで「ウェブ」にフィルタリング

GoogleアナリティクスのGoogleオーガニックは、すべてのタイプのGoogle検索からのトラフィックを含みます(有料検索のAdWordsは含まない)。

フィルタを外すと近い数字になるかもしれません。

意外に見落としがちです。

計測方法

検索クエリは「検索結果のクリック」で計測します。

対して、Googleアナリティクスは「JavaScriptのトラッキングコード」で計測します(使っている用語が比較対象として正しくないかもしれませんがここでは重要ではありません。計測の仕組みが異なるっていることが重要です)。

JavaScriptの有効・無効

上で書いたように、GoogleアナリティクスはJavaScriptで計測します。
ブラウザでJavaScriptを無効にしていたり、何らかの事情でJavaScriptが正常に動かなかった場合はGoogleアナリティクスでは計測から漏れます。

一方でウェブマスターツールの検索クエリは、JavaScriptの有効・無効に依存しません。

セッションの管理

Googleアナリティクスには「セッション」という概念があります。
同一セッションをまとめた場合、Googleアナリティクスのデータが少なくなります。

タイムゾーン

集計のタイミングが異なります。

検索クエリは太平洋夏時間(PDT)に基いて毎日のデータを集計します(PSTを使わずに1年中PDTなんですね)。
ちなみに検索クエリに限らず、ウェブマスターツールのデータはすべて米Google本社がある地域の太平洋時間で表示されます。

Googleアナリティクスは、あなたが設定した時間帯で集計されます。
たいてい日本時間に合わせているはずです。

反映時間

レポートにデータが反映されるまでの時間差です。

検索クエリの方が遅いんじゃないですかね。

Googleアナリティクスの参照元の特殊な処理

Googleアナリティクスは、ブックマークやURL直打ちのような「参照元なし」のアクセスであっても前回訪問時にGoogle検索からアクセスしていると、「Googleのオーガニック」としてレポートします。

つまり実際には検索からではなく直接やって来たのに、データにはGoogle検索として計上されるのです。
検索していないのに、キーワードにも前回のキーワードが記録されます。

したがってウェブマスターツールの検索クエリに出てこない検索トラフィックが、Googleアナリティクスでは検索トラフィックになってしまうことがあります。

Googleアナリティクスの参照元の処理に関する詳しいことはWeb担当者Forumでの衣袋さんの解説を参照してください。

検索クエリとGoogleアナリティクスのデータが異なる理由として考えられる主だったものは以上です。

これでもとうてい納得がいかないような大きな乖離が生まれているようなら教えてください。
具体的なURLを公開できるのであれば、ヘルプフォーラムに投稿することでGoogleの人に見てもらえるかもしれません。