Googleの“site:”コマンドが改善された?

インデックス数を調べるための“site:”コマンドは、Googleにおいては正確な数字を返さないため信頼できるものではなく、結果としてGoogleでのインデックス数を正確に知る方法はありません。

しかし最近2週間くらいにわたって以前よりも正確なデータをsite:コマンドが表示するようになってきているようだと、WebmasterWorldのメンバーが報告しています。

フォーラム管理者のtedsterもサイトをいくつかチェックしてみて、まあまあ満足のいく程度の正確さに戻ってきているように見えるとコメントしました。

この記事を書いている時点での僕のサイトの状況は次のようになっています。

  • Google.comでのsite:でのインデックス数:約2,800ページ
  • Google.co.jpでのsite:でのインデックス数:約1,580ページ
  • Googleウェブマスターツールでのインデックス数:1,818ページ(サイトマップで送信したURLは2,093ページ)

僕の環境では、どのブラウザを使っても何度検索しても、co.jpとcomのsite:の結果に違いが出ます。
co.jpが必ず極端に少ないです。
試しに他の国でのGoogle、英国・フランス・ドイツ・ロシア・韓国でも調べてみましたが、少ないのは日本だけでした。
他はほぼcomと同じ数字を返しています。
理由は分かりません。

Googleウェブマスターツールで確認できるインデックス数はXMLサイトマップで送信したURLだけです。
僕はサイトマップに含めていないURLもあるので、site:検索で調べた数字の方が多いのは不思議なことではありません。

正確なページ数を把握しているわけではないので、Google.comでのインデックス数が実際とどの程度近いかははっきり判断できません。
ただ感覚的にはGoogle.comが返した数字に近そうに感じます。

明確に断言できないものの、確かにGoogle.comでのsite:コマンドは少なくとも前よりは信頼度のおけるデータを返すようになっているのかもしれません。

ただし先にも書いたようにGoogle.co.jpのsite:コマンドは依然として頼りにならない状態が続いているようにも思えます。

インデックス数を調べるなら、Google.comを使ったほうがよさそうです。
もちろんあくまでも“目安”としてのデータであることを忘れてはいけません。

site:コマンドが以前より正確になったことをレポートしているSearch Engine Roundtableの記事にGoogleのMatt Cutts(マット・カッツ)氏が次のようにコメントを投稿しました。

Interesting interpretation, the number of urls that are ‘indexed’ in webmaster tools is the number of URLS that are going to get cached. The URLS that are shown when using the “site:” operator could potentially be old URLS that are not going to be re-indexed. These URLS can be removed in webmaster tools.

“おもしろい解釈だ。ウェブマスターツールで「インデックスされている」URLの数は、キャッシュされるであろうURLの数なんだ。site:構文を使ったときに表示されるURLは、再インデックスされない古いURLになる可能性もある。こういったURLはウェブマスターツールでは取り除かれることもあるよ。”

site:で出てくるURLはインデックスから消えることがあるようです。
数字が変動しやすい理由になるかもしれません。
最新の状態はウェブマスターツールで調べたほうがいいということになりそうですね。