検索演算子の技術ドキュメントをGoogleが公開、SEO利用には注意が必要

[レベル: 中級]

Google は、検索演算子(検索構文、検索コマンド)に関する技術ドキュメントを検索セントラルサイトで公開しました。
日本語ページもできあがっています。

SEO にも利用できる 5 つの検索演算子

ドキュメントが取り上げている検索演算子は次の 5 つです。

  • site:―特定のドメイン、URL、または URL プレフィックスによる検索結果を見つける
  • cache:―ページのキャッシュ バージョンを見つける
  • related:―特定の URL に関連するページを見つける
  • src:―特定の画像 URL を参照するページを見つける
  • imagesize:―特定のディメンションの画像を含むページを見つける

使い方によっては、SEOの調査や検証、デバッグに演算子は利用できます。
たとえば、site: はインデックスされているかどうかを簡易的に調べるのに応用できます。
特定のクエリを指定してハッキングやコメントスパムを発見するツールとして手助けになります。
imagesize: はサイト上のサイズが小さい画像を発見するのに役立ちます。

それぞれの演算子の詳しい機能や使い方に関してはドキュメントを参照してください。

次の演算子には個別に解説するページも公開されています。

演算子の SEO 利用には注意が必要

注意したいのは、検索演算子は万能ではない点です。
特に正確な状態を把握するときには、URL 検査ツールが適している場合が少なくありません。
仕様や制限をきちんと理解したうえで検査ツールを使わないと、必ずしも正確とは言えない情報に振り回されてしまいます。

注意点と制限についてもドキュメントは言及しています。
いくつかを引用します。

site: の注意点の例

URL が Google のインデックスに登録されていれば、その URL に関連する site: クエリの検索結果に表示される可能性がありますが、常に表示される保証はありません

site: で)返される URL のリストは網羅的ではありません。大規模なサイトでは、サイト内のすべての URL が結果に表示されることは期待できません

site: 演算子は、クエリで指定したプレフィックスに関連してインデックス登録されているすべての URL を返すわけではありません

クエリなしの site: 演算子(例: site:example.com)は、結果をランク付けしません。通常は、そのプレフィックスに対応する最も短い URL が一番上に表示されますが、それ以外の結果はほぼランダムです

※強調はすべて僕による

site: は特に、未熟な理解で使う人が多い演算子です。
インデックス確認のために site: を使うべきではないとこのブログでも以前に説明しました。

cache: の注意点の例

ページのキャッシュ バージョンが存在しなくても、そのページまたはコンテンツが不適切というわけではありません。また、そのことが Google 検索結果におけるページのパフォーマンスに影響することもありません。

実際のキャッシュ バージョンは、不完全な場合や空の場合もあります。その原因としては、ページの実際のレイアウトを作成する役割を果たす JavaScript オペレーションが、ブラウザの同一オリジン ポリシーによってブロックされたことが考えられます。これは正常な動作であり、修正は不要です。

Google 検索のキャッシュを SEO 目的で使うべきではないこともこのブログで説明しました。

画像検索の演算子の注意点の例

画像検索演算子はインデックス登録の制限と取得対象の制限を受けるため、標準的な検索クエリであれば表示される結果の一部が表示されないことがあります。

たとえば、Wikipedia 内の画像を対象に
imagesize:1200x600 site:http://wikipedia.org
と検索したとします。
すべての 1200px*600px の画像は検索結果に出てこないでしょう。
Wikipedia には膨大な数の画像があるため、すべてを処理、検出するには長い時間がかかります。
ユーザーが待ちきれません。

仕様を正しく理解していれば、各種の検索演算子は SEO におおいに役立ちます。
逆に言えば、表面上の機能だけしか知らずに利用すると混乱や、ときには誤った判断の原因になります。
SEO 上級者を目指すのであれば、Google が新たに公開した検索演算子のドキュメントをきちんと読むことを強く推奨します。