Google、2024年3月のスパムアップデートを開始。寄生サイト対策に本腰を入れる

[レベル: 中級]

March 2024 spam update(2024 年 3 月のスパムアップデート)の展開を 2024 年 3 月 5 日(太平洋時間)に Google は開始しました。
展開完了までには 2 週間程度かかる見込みです。

また関連して、スパムポリシーを更新しました。
今回のスパムアップデートには、このスパムポリシーの更新が反映されています。

3 つのスパムポリシー違反を追加

スパムポリシーに違反する試みとして、次の 3 つの行為を追加しました。

  • Expired domain abuse(期限切れドメインの不正使用)
  • Scaled content abuse(大量生成されたコンテンツの不正使用)
  • Site reputation abuse(サイト評価の不正使用)

それぞれを説明します。

Expired domain abuse

Expired domain abuse(期限切れドメインの不正使用)とは、期限切れのドメイン名を購入し、ユーザーにほとんど価値を提供しないコンテンツをホストすることで、主に検索順位を操作することを目的に再利用することです。

次のような例を Google は挙げています。

  • 以前は政府機関が運営していたサイトで、現在はアフィリエイトコンテンツが掲載されている
  • かつては非営利の医療チャリティ団体が運営していたサイトで、現在は営利の医療製品が販売されている
  • かつては小学校のサイトだったものが、現在はカジノ関連のコンテンツで使われている

中古ドメインを悪用したスパムは、今に始まったことではありません。
たびたび問題視されています。

これまでも Google は対策してきたはずなのですが、完全には処理できていませんでした。
対策強化の効果が出ることを祈りましょう。

なお、だれか他の人が以前に所有していて期限切れになったドメイン名を再取得して利用すること自体はスパムではありません。
ドメイン名は同じでも、ユーザーを第一に考えた独自のオリジナルサイトを新たに公開していればまったく問題ありません。

ドメイン名の過去の評価(たとえば被リンク)を利用して、検索結果において価値の低いコンテンツで上位表示させることを企てる手法を Google はスパムとみなします。

Scaled content abuse

Scaled content abuse(大量生成されたコンテンツの不正使用)とは、検索順位を操作することを主な目的として、ユーザーには役に立たないページを大量に生成することです。
通常、ユーザーにほとんど価値を提供しない、オリジナルではないコンテンツの大量作成に重点が置かれます。

価値が低いコンテンツの大量生成は、以前の、ツールを使用した自動生成スパムを拡張したものです。
Scaled content abuse では、どのように作成されたかは問題ではありません。
ツール(生成 AI 含む)を使った自動生成コンテンツであろうが、人力(たとえば安価で雇った多数のクラウドワーカーたち)で書かせた記事であろうが、検索からのトラフィックを集めることを主目的とし、ユーザーの役に立つことを第一に考えていないコンテンツの大量生成が該当します。

大量生成されたコンテンツの不正使用には次のような例があります。

  • ユーザーに価値を付加することなく、生成 AI ツールなどを使って大量のページを生成する行為
  • フィード、検索結果、その他のコンテンツをスクレイピングして多数のページを生成する行為(同義語置換、翻訳、その他の難読化手法による自動変換を含む)。ユーザーにほとんど価値がない場合
  • 別のウェブページからコンテンツを複製または組み合わせる行為で、価値が付加されていない場合
  • コンテンツの大量生成を隠す目的で複数のサイトを作成する行為
  • 読者には意味不明だがキーワードだけが含まれるようなコンテンツの多数のページを作成する行為

Scaled content abuse について、次の 2 つの質問に Google は回答しています。

Q. これは、スパムに関してGoogleがAIコンテンツを見る方法の変化ですか?

A. Google の長期にわたるスパムポリシーは、主に検索結果でのランキングを操作することを目的とした、生成型 AI を含む自動化の使用はスパムであるというものです。 更新されたポリシーは、以前のポリシーと同じ精神に基づいており、同じ原則に基づいています。 純粋に自動化によって作成された低品質のコンテンツかどうかが常に明確ではない、より高度な大量生成されたコンテンツ作成手法を考慮できるように拡張されました。

Q.「自動生成コンテンツ」に対する古いポリシーと、「大量生成された不正使用」に対する更新されたポリシーの違いは何ですか?

新しいポリシーでは、検索ランキングの操作を目的とした大量のコンテンツ作成が悪質な行為であり、それが自動化か人力かは問わないという点により重点が置かれています。

Site reputation abuse

Site reputation abuse(サイトの評判の不正使用)とは、サイト運営者による関与や監視がほとんど、またはまったくない第三者のページが公開され、そのサイトの評価を利用して検索ランキングを操作することを指します。
いわゆる、Parasite site(寄生サイト)スパムです。
📝すずきメモ:「寄生サイト」は Google が公式に使う呼び名ではなく、辻さんが考えた蔑称かな?

こうした第三者のページには、広告やパートナー、その他の第三者によるページが含まれ、通常はホストサイトの本来の目的から外れており、ユーザーにほとんど価値がありません。

次のようなやり口が、Google が挙げているサイトの評判の不正使用の例です。

  • 教育サイトで、ランキング操作を主な目的として、同じページをウェブ上の他のサイトでも配布している第三者による質屋ローンのレビューページをホストしている場合
  • 医療サイトで、そのサイト自体の関与がほとんどないまま、ランキング操作を主な目的とした「おすすめカジノ」の第三者ページをホストしている場合
  • 映画レビューサイトで、「SNS のフォロワー購入方法」「おすすめ占い師サイト」「おすすめ小論文作成サービス」などユーザーが見つけて混乱するようなトピックについて、ランキング操作を目的とした第三者のページをホストしている場合
  • スポーツサイトで、サイト編集部の関与がほとんどないまま、ランキング操作を主目的として第三者による「ワークアウトサプリメントレビュー」のページをホストしている場合
  • ニュースサイトで、ホストサイトの監視や関与がほとんどなく、検索ランキング操作が主な目的で第三者提供のクーポンページをホストしている場合

一方で、次のような形式のサイトは「サイトの評判の不正使用」とはみなされません。

  • ワイヤーサービスまたはプレスリリース配信サービスのサイト
  • 他のニュース媒体からニュースコンテンツをシンジケートしている報道機関
  • フォーラムサイトやコメント欄など、ユーザー生成コンテンツを許可するように設計されたサイト
  • ホストサイトが深く関与または監修しているコラム、意見記事、論説、その他の編集の性質を持つ作品
  • ホストサイトが深く関与して制作した第三者コンテンツ(「ネイティブ広告」のようなタイプのページなど)で、検索ランキング操作ではなく出版物内での宣伝を通じて直接読者に共有することが目的のもの
  • ページ内に第三者の広告ユニットや適切に扱われたアフィリエイトリンクを埋め込んでいるもの
  • ホストサイトが深く関与して掲載しているクーポン配布サイト

第三者のサイトでホストされるすべてのコンテンツがポリシー違反と見なされるわけではありません。
厳密な監視なしでホストされ、検索順位を操作することを目的としているもののみが対象となります。
ようは、無関係である第三者のサイトの一部を間借りして、そのサイトの検索での評価をうまいこと享受して上位表示を狙う手法です。

なお、サイトの評判の不正使用のスパムポリシーは、2024 年 5 月 5 日から適用されます。
📝すずき補足:(先に説明した「期限切れドメインの不正使用」と「大量生成されたコンテンツの不正使用」は適用済み)
サイトの一部を第三者に貸し出しているサイトの管理者に対処ための猶予期間を与えるためです。

今年のこどもの日以降、寄生サイトを Google が本当に撲滅できるか注視しましょう。

【UPDATE (2024/3/21)】
2024 年 3 月 20 日(太平洋時間)に展開完了