外部流出したGoogle内部文書を解析-その3(現物のPDFも公開)

No Spam
昨日に続いて、外部に流出したGoogleの内部ドキュメントのウェブスパムに関するセクションを解説します。

  1. PPC Pages
  2. Parked Domains
  3. Thin Affiliates
  4. Hidden Text and Hidden Links
  5. JavaScript Redirects
  6. Keyword Stuffing
  7. 100% Frame
  8. Sneaky Redirects

今日は残りの後半4つです。


JavaScript Redirectは、ジャバスクリプトを使ったリダイレクトで、サーチエンジンのロボットと人間のユーザーに別々のウェブページを見せます。
いわゆるCloaking(クローキング)です。
検索エンジンのスパイダーを、上位表示のためだけに仕込んだ特別なウェブページに振り分け、人間には通常のウェブページを表示します。

●JavaScript Redirectの例 ⇒ http://infocoach.biz/url/jsredir/
↑、僕が作りました。(笑)
ブラウザのアドレス欄にコピペしてアクセスしてみてください。
ぜんぜん違うサイトにアクセスします。

JavaScriptリダイレクトを見分けるには、怪しいと思ったらキャッシュを見ます。
キャッシュされているページとブラウザで見えるページが異なる場合は、リダイレクトを疑います。
キャッシュは、サーチエンジンが見たデータだからです。
ブラウザのJavascript機能をオフにしてアクセスして、リダイレクトされていないか確認します。


Keyword stuffingは、ターゲットのキーワードや関連するキーワードを詰め込む(Stuff)ことで、検索順位をあげようとする行為です。

Hidden Text(隠しテキスト)と併用して使われることも多くあります。
時には、「mortgage(ローン)」、「gamble(ギャンブル)」のような語句を、アクセスを集めるためだけに詰め込むこともあります。

コンテンツではなく、URLにキーワードを詰め込むキーワードスタッフィングもあります。
●URLキーワードスタッフィングの例 ⇒ http://apply-bankruptcy-card-credit.luciddomains.com/index.html
クレジットカード破産申請

Keyword Stufftingは、見れば、たいていすぐに気付きます。


100% frameは、フレームを使ってアドレスバーに表示されているURLと、実際に表示されているページのURLを異なるようにし、URLを偽装します。

●100% frameの例 ⇒ http://www.suzukikenichi.com/cloaking/case1
↑、これも僕が作りました。(爆)
コピペしてアクセスしてください。

見分けるには、ページで右クリックしてみるプロパティで表示されるURLとアドレスバーで表示されるURLを比較します。


Sneaky redirectは、卑劣な転送手法で、ユーザーを複数のURLを経由して別ドメインのランディングページ(最終到達ページ)にたどり着かせます。
サーチエンジンがインデックスするのは最初のページですが、ユーザーがアクセスするのは違うページです。

アクセスするたびに、異なるページへリダイレクトする場合もあります。

社名が変わったりして、別のドメインにリダイレクトするのは容認されます。
同じドメインの別のページへのリダイレクトも容認されます。

不正なリダイレクトを疑ったときは、2つのドメインの所有者をWhois情報で検索して調べます。
所有者が同じなら、Sneaky redirectではありません。

以上が、後半の4つのWeb Spamに関しての解説です。

キーワードスタッフィングは、古典的なサーチエンジンスパムですね。
リダイレクトによるクローキングは、マニュアルに載っていたもの以外にもさまざまな手法があります。
もし最新のバージョンのガイドラインがあるなら、そういうのも載っているんでしょうか?

EWOQという評価者が使うツールには、「Rater Hub」というリソースページがあり、そこにはスパムサイトの実例が紹介されているそうです。

最初のうちはスパムの発見は容易ではないけれど、経験を積めば見分けられるようになると注釈がありました。

ウェブスパムかどうか確信が持てないときは、スパムとは判定すべきではないとの指示です。
スパムでないサイトを間違ってスパム扱いするよりは、スパムサイトを残しておく方が好ましいと考えているからだそうです。

Googleの検索結果を検査する人間の評価者のために作られたという、内部マニュアルをシリーズで解説してきました。

本当にGoogleの内部文書かどうかの真偽は分かりません。
かなりの確立で、信頼できそうではありますが。

偽物だとしても、ウェブマスターにとっては有益な情報であることに変わりはないと思います。

マニュアル本体のPDFファイルがインターネットに出回ってます。
すでに有名どころのSEOブログでも公開されているので、僕も入手先を教えます。

こちらからどうぞ。
※削除されている可能性あり(教えてください)