[レベル: 初〜中級]
ページのなかにある特定のキーワードや段落をGooglebotから隠し、インデックスさせないようにすることはできません。
もし何らかの手段を用いて、ユーザーには見えるけれどGooglebotには見えないようにしたとすると、それはクローキングとしてみなされることがあります。
また、Google Search Consoleで利用できるコンテンツキーワードは、サイトのなかでどんなキーワードが多く使われているかを単純にレポートするだけです。
Googleが重要視しているキーワードを知るためのツールではありません。
特定のキーワードをGooglebotから隠す方法はない、隠したらクローキングになる
Stack Overflowで次のような趣旨の質問が投稿されました。
“〜 days ago”(◯日前)というワードをブログ記事で繰り返し使っていたら、(Search Consoleの)コンテンツキーワードで上位に来てしまった。そうなってほしくないのだが、どうやったらそのワードを検索エンジンから隠すことができるだろうか?
JavaScriptは使いたくなくて、PHPなら簡単に隠す設定ができる。ただ検索エンジンから隠すとクローキングになってしまうのではないかと心配している。
この質問に対して、GoogleのGary Illyes(ゲイリー・イリーズ)氏がコメントを書き込みます。
その特定のテキストの部分についてはまず心配しなくていいと思う。僕たちのアルゴリズムは定形テキストの検出が比較的得意だ。質問内容から判断する限りでは、そのワードは定形テキストで、僕たちはもう気付いていそうだ。
Googlebotを検出してそのテキスト部を表示しないことに関して言えば、キミは正しい。クローキングになりそうだし絶対にやっちゃダメだ。それに、そのテキスト部を僕たちから隠してしまったら定型文だと検出することが困難になってしまい、結局はまさに避けようとしていたことをやってしまう羽目になる。
ページ全体をインデックスさせないようにしたいなら、noindex robots meta タグが使えます。
しかし、少なくともGoogleに限定して言えば、ページのなかの特定のキーワードや段落だけをインデックスさせないようにする仕組みは存在しません。
<!--googleoff: index-->
というタグで囲むことによって、特定のブロックをインデックスさせない仕組みが存在することを知っている人がいるかもしれません。
ですが、これはGoogle検索アプライアンスだけで機能する仕組みであり通常のウェブ検索では機能しません。
また、JavaScriptやPHPなどで動的にコンテンツを生成するようにし、Googlebotを検出してGooglebotには見せないようにすることが技術的には可能です。
質問者はJavaScriptを使いたくないと言っていますが、たとえばそのコンテンツを生成するJSをrobots.txtでブロックしておけば検索エンジンには見せなくすることが簡単にできます。
ですが、そのコンテンツがページのなかの比較的大切なコンテンツならクローキングになるでしょう。
ユーザーには見えるのに、検索エンジンには見えないようにしているからです。
クローキングにならなかったとしても、そのコンテンツをGooglebotが見ることができないため、正しい評価の妨げになります。
逆効果です。
コンテンツキーワードはハッキング検出に役立つ
質問者は続けて、次のように尋ねます。
でもコンテンツキーワードで、“days ago”がもっとも重要なキーワードのひとつになってしまっているのだが?
イリーズ氏はこう説明します。
コンテンツキーワードは、ただ単に、Googleがサイトから取得した素の状態での見え方にすぎない。
コンテンツキーワードはハッキングの検出に特に役立つ。たとえば「Viagra(バイアグラ)」というキーワードを見つけて、でもサイトのなかにそんなキーワードがあるはずがないのなら、ハッキングされている可能性が高い。
Googleがどんなキーワードやフレーズを見ているのかを知るのにもっといい方法は、検索アナリティクスの機能だ。ユーザーがどうやって検索から来ているかを解明してくれる。
Search Consoleのコンテンツキーワードは、単純にGoogleがサイト内で認識したキーワードの数が多い順に並んでいるだけです。
順位が高いほど重視しているわけではまったくありません。
「重要度 (Significance)」というラベルが誤解を招きますね。
通常は気にするものではなく、イリーズ氏が言うように書いたはずがないキーワードが含まれているときにハッキングを疑うことに役立ちます。
質問者のケースでは、ここにブログ記事で繰り返し使っていた“days ago”が上位に出てきてしまったようです。
しかしイリーズ氏によれば、サイト内で繰り返し使われるワードは定形テキストとしてGoogleに認識されます。
数が多いからといって良くも悪くも何か目立つ影響を与えるものではありません。
Search Consoleのコンテンツキーワードは、特にSEOにまだ詳しくないサイト管理者を戸惑わせがちなデータなので注意しましょう。