以前に、robotsタグのnoindex/nofollow/noarchive属性について解説したことがあります。
名前は似ていますがそろぞれ独立した存在で、使う目的も、検索に与える結果もまったく異なります。
今日は、このうちのnoindex属性について、少し古いのですがGoogleのMatt Cutts氏のインタビューを参照しながら、再度説明したいと思います。
noindex属性は、headセクションに次のように記述します。
<meta name="robots" content="noindex">
または
<meta name="robots" content="noindex" />
上はHTML、下はXHTMLの場合です。
name属性の「robots」はすべての検索エンジンのロボットを対象にしますが、特定の検索エンジンのロボットを対象にする時は、googlebotやslurpなど各検索エンジンのロボット名を指定できます。
noindexタグを記述すると、そのページは「検索結果に現れなくなります」。
ただし、インデックスされないということではありません。
裏側では、通常のページと同じようにインデックスされます。
SERPに表示されなくなる、つまりいかなる検索にもヒットしくなるだけです。
当然、発リンクがあればPageRankをリンク先のページに渡します。
noindexの使い道としては、たとえば複製コンテンツを防ぐことがあります。
同じコンテンツのページを複数インデックスさせることはユーザーにとって不便なので、通常、検索エンジンはフィルタリングして検索結果から除外します。
しかし、フィルタリングされたページであってもリンク先ページにはPageRankが流れます。
もう1つの例としては、ログインページがあります。
ログインページはコンテンツに乏しいので、検索結果に出させる必要がないと考えるサイト管理者は、noindexを付けることがあります。
ですが、ログインページは他のサイトからリンクが張られることも多そうです。
せっかく集まったPageRankを、サイト内の別ページにも内部リンクとして供給したいですよね。
noindexを記述しておくと検索結果には出なくなりますがリンク先ページにはPageRankを渡すことができます。。
noindexとは反対に、インデックスさせるという目的で「index」属性がありますが、noindexがなければ普通にインデックスするので、あえて明示的に記述する必要はありません。
noindexと併用して使われることの多いnofollow(metaタグのnofollowのこと、rel=”nofollow”ではない)は、最初にも言ったようにまったく別の働きをします。
nofollowは、ロボットがページ内のリンクをたどることを禁止します。
したがって、リンク先ページにアクセスしないので、PageRankも渡しません。
meta robotsタグのnofollowを記述すると、ページ内のすべてのリンク先にPageRankを流さなくなります(個別のリンクに設定するのが、aタグに付けるrel=”nofollow”ですね)。
meta nofollowは、無料のホームページスペースで記述されたりします。
被リンク用の自作サイトとして不正利用されるのを防ぐためです。
metaタグのnoindexは頻繁に使わないとしても、その働きと仕組みを知っておくといざというとき役立つでしょう。