Search Consoleの検索パフォーマンスレポートでデータの不一致が発生する理由をGoogleが説明

[レベル: 上級]

Search Console の検索パフォーマンス レポートに関して、データの提供方法とフィルタリングの仕組みについて Google は公式ブログで解説しました。

全体的には、ヘルプ記事に書かれている内容の抜粋に近いのですが、匿名化されたクエリにより発生するデータの不一致については特に注意が必要です。

この記事で一緒に再確認しましょう。

匿名化されたクエリが原因でデータの不一致が発生する

匿名化されたクエリとは、ユーザーのプライバシーを保護するためにレポートから除外されるクエリです。

ただし次の 2 点には注意が必要です。

  • グラフの合計数には含まれる
  • フィルタが適用されると合計数に差が生じる

順に説明します。

匿名化されたクエリは合計数に含まれる

ブログ記事で Google は、次のサンプルデータでこれらの注意点を説明しています。

クエリ クリック数
古典文学 150
125
サイエンスフィクション 100
ノンフィクション 75
各項目のクエリの合計 450
合計 550

考古学と詩、サイエンスフィクション、フィクションの 4 つのクエリがレポートされていたとします。
📝すずき注: 通常のサイトのクエリ数はもっと多いはずだが、わかりやすくするために 4 つだけにしている

これら 4 つのクエリのクリック数を合計すると 450 (150 + 125 + 100 + 75) になります。
しかしながら、レポートの合計は 550 になっています。
これは、匿名化されたクエリの 100 が含まれているためです。

つまり、匿名化されたクエリは項目別からは省略されているのですが、合計には含まれているのです。
匿名化されたクエリが多ければ多いほど、レポートされている各クエリの合計数と、レポートに出ている合計数の差が大きくなります。

Search Console では、検索結果におけるクリックのうち 46.08% は、どんなクエリで検索結果に表示されたのかがデータとして提供されていないなんていう調査結果が公表されています。
匿名化されたクエリが合計数には含まれていることに起因する調査結果と言えるでしょう。
📝すずき補足: 匿名化されたクエリ以外にもレポートされないクエリがあるので、なおさら不一致が起こる

フィルタ適用時には匿名化されたクエリは合計数に含まれない

さらにやっかいなことに、フィルタが適用されると、匿名化されたクエリは合計数に今度は含まれなくなります。
「次を含むクエリ: 特定の文字列」を適用した場合の合計数と「次を含まないクエリ: 特定の文字列」を適用した場合の合計数を足すと、全体のレポート数に大きな違いが見られることがあります。

上のサンプリデータで説明します。

  • 「フィクション」が含まれるクエリでフィルタする ⇒ 175(「サイエンスフィクション」の 100 回と「ノンフィクション」の 75 回)
  • 「フィクション」が含まれないクエリでフィルタする ⇒ 275(「古典文学」の 150 回と「詩」の 125 回)

「フィクション」が含まれるクエリと含まれないクエリの和は 450 です。
クエリの合計数と一致するはずです。

ところが、レポートされているクエリ全体の合計数は 550 です。
100 の差が出てきます。

このように、一部のフィルタ使用時にはデータの不一致が発生するのです。

📝すずき注: この記事を書いている時点では、日本語訳のブログ記事では、サンプルデータの「サイエンスフィクション」が「SF」と記載されている。そのためフィルタ適用時の例の意味が通じなくなる。
修正リクエスト中。

冒頭でも言及したように、データの不一致に関してはヘルプ記事に以前から説明があります。
ですが、きちんと読み込んでいる人はそう多くはないかもしれません。
ブログ記事とあわせて、検索レポートの仕組みをこの機会に確認しておきましょう。