[レベル: 中級]
サイトマップには、クロール・インデックスさせたいURLを記載します。
一般的には、インデックスさせるという目的から外れている、次のようなURLをサイトマップに記載すべきではありません。
- robots.txtでブロックしているURL
- noindexで検索結果から非表示にしているURL
- 404エラーを返しているURL
- リダイレクト元のURL
しかし、クロールを促すサイトマップの特性を利用してインデックスから早急に消したいときには、例外的に、そのURLをサイトマップに記載するという手法を利用することができます。
インデックス非表示にしたいページには「noindex + サイトマップ」がおすすめ
低品質コンテンツは削除するよりも高品質コンテンツになるように改善した方がいいという、GoogleのGary Illyes(ゲイリー・イリーズ)氏とフォロワーたちのTwitterでのやりとりをちょうど1周間前の記事で取り上げました。
一連のやり取りのあと、あるフォロワーが次のように続けて質問しました。
コンテンツが本当にひどくて、もう消したいときは(404よりも)410のほうがいいんですよね?
イリーズ氏は次のように回答します。
どちらでも構わないと思う。どちらかがいいということはない。だけど、「noindexとサイトマップ」を強く推奨する。
低品質ページにはnoindex robots meta タグを記述して、さらにサイトマップに記載して検索結果に出さないようにした方がいいとイリーズ氏はアドバイスしたのです。
noindexページをサイトマップに記述できる?
一見すると何の問題もないかのように思えるかもしれません。
ですが冒頭でも書いたように、サイトマップはインデックス登録(またはインデックス更新)を最終的な目的としてクロールを促進するために使う仕組みです。
検索結果に出さないURLを記述すべきではありません。
John Mueller(ジョン・ミューラー)氏も、ヘルプフォーラムやオフィスアワーなどでそう言っていたことがあると僕は記憶しています。
ところが、イリーズ氏はnoindexページをサイトマップに記述することを勧めています。
「noindex + サイトマップ」の構成は“あり”なのでしょうか?
処理速度アップが目的で一時的ならOK
イリーズ氏のアドバイスが引っかかったのでイリーズ氏本人とミューラー氏に質問してみました。
すると次のような回答をもらえました。
ミューラー氏: ああ、大丈夫だ。noindexページを一時的にサイトマップに載せるのは構わない。だが長期間残しておくのは意味がない。
イリーズ氏: 僕がそうしたURLをサイトマップの載せるように勧めた唯一の理由は、再クロールをスピードを上げるからだ。本当には任意でやることだ。
急いで検索結果から消したくて、そのために再クロールを促すという理由があり、かつ一時的であるならnoindexタグを記述したページをサイトマップに記載しても問題ないというのが結論です。
たいていの場合、noindexページであろうが404ページであろうがサイトマップに記載されれば、通常よりも早くそのURLはクロールされるとのことです。
@nishanthstephen generally anything you put in a sitemap will be picked up sooner
— Gary Illyes (@methode) 2015, 10月 13
@nishanthstephen yep
— Gary Illyes (@methode) 2015, 10月 13
インデックスから消したいURLをサイトマップに書くというのは、サイトマップのちょっとした“裏ワザ”みたいなものですかね。
Googleのお墨付き(?)なので、使いたい場面が出てきたら使ってみるのもいいでしょう。
ただし、ずっとそのままにしておかないように気を付けましょう。
原則的には、クロール・インデックスさせるURLをサイトマップには記載します。