GoogleアナリティクスとSearch Consoleのデータ乖離はなぜ発生するのか? Googleが詳しく説明

[レベル: 初級]

Google アナリティクスと Search Console を SEO に活用するための技術ドキュメントを Google は検索セントラルサイトに新規公開しました。

このドキュメントは、Google アナリティクスと Search Console のデータに乖離が発生する理由も説明しています。

両ツールのデータの際についてはしばしば問題にあがります。
この記事を書いている時点ではドキュメントは英語のみで日本語訳はまだなので、一緒に確認しましょう。

GA と SC 間のデータ差異について理解する

Google アナリティクスと Search Console 間にデータ差異を発生させる可能性のある原因としてドキュメントは次の 8 つの要因を挙げています。

  • Google アナリティクスの実装
  • Cookie/トラッキング
  • タイムゾーン
  • アトリビューション
  • 正規 URL
  • トラフィック分類
  • 非 HTML ページ
  • ボットトラフィック

順に見ていきます(引用タグ内の説明は僕による英語原文の翻訳)。

Google アナリティクスの実装

Google Analytics は、ウェブサイトやアプリにタグを実装することでユーザーの行動データを収集できるツールです。そのため、どのように実装するかによってデータの収集方法が異なります。Google Analytics では、実装や設定の問題がデータの品質に影響を与える可能性があります。たとえば、ウェブサイト内に Analytics のタグが欠落しているページがあるかもしれません。適切に設定されているかを確認するには、セットアップガイドの手順に従ってください。

一方、Search Console は Google 検索データにアクセスできるツールであり、すべてのプロパティに対して Google によって均一に処理されます。つまり、設定方法がデータに与える影響は少なくなります。

Google アナリティクスは、サイト管理者がタグ(トラッキングコード)を設置してブラウザまたはアプリでユーザーがサイト内で起こしたアクション/イベントを計測します。
一方、Search Console は Google が検索結果で起きたこと(表示やクリック)を計測します。
サイト管理者による Google アナリティクスの実装がデータの差異を生む場合があります。

Cookie/トラッキング

サイトがユーザーにトラッキングの許可を求め、ユーザーがオプトアウトした場合、Google Analytics のデータに偏りが生じる可能性があります。Analytics の観点からこの問題に対処する方法については、「ユーザー同意管理の概要」をご覧ください。

Google アナリティクスのトラッキングをユーザーは拒否できます。
また、ブラウザの Cookie に依存します。

一方、Search Console にレポートされる検索結果でのトラッキングは通常は無効にできません。
Cookie にも依存しません。

タイムゾーン

Google Analytics ではタイムゾーンを選択できますが、Search Console では、デフォルトのタイムゾーンが PST(太平洋標準時)に固定されています。特に、Google Analytics でオーストラリアのように PST から大きくずれたタイムゾーンを設定している場合、この違いが顕著になります。

タイムゾーンの違いにより日にちの区切りが異なります。
PST との時差が大きくなればなるほど差が目立つ場合があります。

なお、太平洋標準時と日本標準時 (JST) の時差は 17 時間です。
日本の方が 17 時間進んでいます。

アトリビューション

Google Analytics では 3 つのアトリビューションモデルを選択できますが、Search Console は Google 検索のすべてのクリックをカウントします。そのため、Google Analytics のデフォルトモデルが最も近いアトリビューションモデルとなります。

Google アナリティクスでの 3 つのアトリビューションモデルを利用できます。

  • データドリブン アトリビューション
  • 有料およびオーガニックのラストクリック
  • Google の有料チャネル(ラストクリック)

Search Console ではアトリビューションは関係しません。
アトリビューションの詳細についてはヘルプ記事を参照してください。

正規 URL

Search Console は Google 検索の正規 URL(canonical URL)に基づいてレポートを作成するのに対し、Google Analytics はトラッキングコードが含まれるすべての URL をレポートに含めます。そのため、Google Analytics ではより多くの URL が表示される可能性があります。

Search Console は、rel="canonical" やその他のシグナルによって URL が異なっていても同一または類似したページと Google がみなせば 1 つのページとして処理されます。
対して Google アナリティクスは、たとえば、ページ内容を変化させないパラメータ(たとえばトラッキングパラメータ)が付いていれば、実際には同一ページでも別ページとして計測します。

トラフィック分類

Search Console では、トラフィックを「ウェブ」「画像」「動画」「ニュース」「Discover」に分類して表示します。Google Analytics とは異なるカテゴリ分けになっています。

分類の違いがデータ差異の理由になる場合があります。

非 HTML ページ

サイトに非 HTML ページ(例:PDF)が含まれている場合、Search Console はこれらのページを検索結果に表示・クリックされた際にデフォルトで含めます。一方、Google Analytics ではこれらのページを計測する設定になっていない可能性があります。まずは、拡張計測機能イベント(を有効にすることを検討してください。

HTML ページ(ウェブページ)に限らず、PDF や CSV、Microsoft Word など Google がインデックス登録が可能なファイルが検索結果に表示されたりクリックされた場合は Search Console はそれもレポートに含めます。
Google アナリティクスでこれらを計測するには設定が必要です。

ボットトラフィック

Google Analytics は既知のボットやクローラーからのトラフィックを自動的に除外しますが、Search Console では必ずしもフィルタリングされるとは限りません。

Google はつい先日、JavaScript の実行を検索で要求するように仕様変更しました。
スクレイピングやボットなどの自動化ツールのアクセスを排除する目的も兼ねていましたが、ツール側も対応してしまい、今でも防げていません。
ボット除外では、Google Analytics の方が上手に対処できているはずです。

ドキュメントが取り上げている、Google アナリティクスと Search Console のデータ乖離の原因となりうる要因は以上です。
多少の差異はこれらの要因で説明できるでしょう。
無視できないよな大きな差異が発生している場合は、これらの要因をヒントにさらに詳しく調査してみてください。