[レベル: 初〜中級]
ページを削除したときには、404と410のどちらのHTTPステータスコードを返すべきなのでしょうか?
結論を一言でいえば、Googleにおいてはどちらでも構いません。
再クロール率にも影響しません。
Googleのミューラー氏による説明
GoogleのJohn Mueller(ジョン・ミューラー)は、ユーザーから受け取った質問メールを引用して、404と410のGoogleの扱いについてGoogle+で説明しました。
I have a large site and removed lots of irrelevant pages for good. Should I return 404 or 410? What’s better for my “crawl budget”? (more from the depths of my inbox)
The 410 (“Gone”) HTTP result code is a clearer sign that these pages are gone for good, and generally Google will drop those pages from the index a tiny bit faster. However, 404 vs 410 doesn’t affect the recrawl rate: we’ll still occasionally check to see if these pages are still gone, espectially when we spot a new link to them.
In practice, I doubt you’ll see a noticable difference at all between 404 and 410, so while it’s great to use 410 in situations where you’re sure, with regards to Google search, it’s not worth spending too much time on that decision or on its implementation.
大規模なサイトを運用していて、たくさんの無関係なページを永久に削除しました。404と410のどちらを返すべきでしょうか? “クロールバジェット”に対してはどちらが適切でしょうか?(こういうメールを受け取り、もっと詳細に書かれていた。)
410(Gone)のHTTPステータスコードは、永久にページがなくなったという点で404よりもはっきりしたサインになる。一般的に言って、Googleは410のページをほんの少しだけ速くインデックスから削除する。しかし、404と410は再クロール率には影響を与えない。どちらの場合でも、依然としてページが存在しないかどうかを確かめるために引き続き時おりチェックする。特に、そのページに張られているリンクを見つけたらなおさらだ。
実際のところは、404と410の間に気付くような差異が本当にあるのかどうかも疑わしい。410のほうが間違いなく適切だと確信できるところで410を使うのはいいことだが、Google検索の観点からすれば、どちらにすべきか悩んだり実装したりするのにそんなに時間を費やす価値はない。
違いはあるが、実質的には同じ扱い
HTTPステータスコードの定義上はこうなります。
- 404 ―― Page Not Found(ページが見つからなかった)
- 410 ―― Gone(削除)
404は、ページが見つからなかったというだけであって、サイト管理者がそのページ意図的に削除したかどうかの意味を含みません。
そのときたまたま何かが原因で表示されなかっただけかもしれません。
対して410は、意図的に削除した意味を持ちます。
極端にいえば、「未来永劫、消滅させた」ことを表します。
ですが、Googleに限っていえば、多少は区別しているようですが、目に見えるような違いは現れないのです。
つまり404でも410でも扱いにおける実質的な違いはありません。
410は設定が必要、404は不要
410では、なくなったURLへのリクエストに対してサーバーが410を返すようにあなた自身で設定する必要があります。
一方で、ページがなくなったときはサーバーは通常は404を返します。
あなたは特別に何かする必要はありません。
410でもGooglebotは再訪問する
404を返したURLであっても、今でも存在しないかどうかを確かめるためにGooglebotはそのページを再訪問します(通常のURLよりは再訪問の間隔はずっと長い)。
これはたとえ410であって同様です。
定義上は「削除」なのですが、410のURLも再び訪れることがあります。
こういった理由からミューラー氏は、わざわざ410にしたからといってメリットはなく、そのまま404を返していいという趣旨の発言をしたのです。
もっとも僕のブログを長く読んでくれている読者であれば、とりたてて新しい情報ではないでしょう。
404と410に対するGoogleの処理はこれまでに多少変化しているようですが、現在の状況では気にするべきものではありません。