コンテンツが古くなったりしてファイルを消した場合など、もう検索結果にウェブページを表示させたくないことがあります。
あるいは、サイトを閉鎖したのにいまだに検索に出続けていているのをどうにかしたい、ということもあるかもしれません。
GoolgleのMatt Cutts(マット・カッツ)氏が、Googleのインデックスからコンテンツを削除する方法を、ビデオで解説しています。
How can I remove old content from Google’s index?
インデックスからのコンテンツ削除には、大きく分けて2つのパターンがあります。
1つは、単一のウェブページを削除するとき、もう1つはサイト全体を削除するときです。
1.単一のウェブページの削除
1) 消したいページのURLにアクセスしたときに、404のHTTPステータスコードを返すようにする。
404は、該当ページが存在しないことを伝えます。コンテンツがないけれど、正常な通信が確立されたことを示す200を返してはいけません。
HTMLファイルをサーバーから削除しておけば、通常は404エラーを返します。
2) Googleウェブマスターツールで、ウェブページの削除リクエストを送信する。
2.サイト全体の削除
1) robots.txtでGooglebotがアクセスできないように設定する。
下のように記述します。
User-agent: Googlebot
Disallow: /
Googleが、1ページ、1ページの削除を処理するのは大変なので一括で処理できるようにするためです。
2) Googleウェブマスターツールで、サイト全体の削除リクエストを送信する。
上の手順がもっとも標準的な方法で、通常はGoogleのインデックスからウェブページもしくはサイト全体が消えるはずです。
削除されるまでの期間はサイトのボリュームにもよると思いますが、単一のページであれば1,2日で処理されることもあります。
この手順でうまくいかない場合は、ヘルプフォーラムで質問してくれとのことです。
日本のヘルプフォーラムでも、親身になって解決を手伝ってくれるユーザーが数名います。
たまに、トンチンカンな回答を返すユーザーもいますが。(笑)