404エラーを修正すべきかどうかはどうやって判断したらいいのか?

[レベル: 中級]

404 エラーを修正すべきかどうかの判断基準を Google の Gary Illyes(ゲイリー・イリース)氏が LinkedIn で説明しました。

404エラーの対処法:必要な URL かどうかで判断する

イリース氏の説明の日本語訳です。
📝すずき注:読みやすいように体裁を若干変更

404 エラー(ページが見つからない)は恐れるべきものではない。ほとんどの場合、慌てて修正する必要もない。

HTTP 404 ステータスコードは、サーバー上の URL がリソースに紐付いていない場合に発生する。つまり、次の2つのケースが考えられる。

  • 本来ならコンテンツを返し 200 ステータスコードを返すべき URL
  • 意図的にコンテンツを返さない URL

後者(意図的にコンテンツを返さない URL)はさらに、ユーザーにとって有用な可能性のある URL と、まったく無意味な URL に分けられる。具体的には次のとおり。

  1. コンテンツを返し 200 ステータスコードを返すべきURL:たとえば、URL に紐づく HTML を誤って削除してしまった場合や、データベースに問題が発生した場合などである。
    これらは、特にユーザーやサイトにとって重要な URL である場合、できるだけ早く修正すべきである。
  2. 意図的にコンテンツを返さない URL:これには 2 つのパターンがある
    • a) ユーザーにとって有用な可能性のある URL:これらの URL は、リダイレクトなどを使ってサイト上の適切なコンテンツに紐付けることを検討すべきである。たとえば、アクセス数の多いページからのリンクが切れている場合、ユーザーがリンクをクリックしても 404 エラーが表示されるが、実際には適切なコンテンツが存在する場合がある。
    • b) まったく無意味な URL:ユーザーの観点からすれば、これらに対して特に対応する必要はない。対応することでかえってユーザーを混乱させる可能性がある。例えば、ビジネスモデルの変更により、もはや取り扱っていない商品(シュールストレミングなど)に関する外部リンクなどが該当する。

一般的な考え方とは異なるが、すべての404エラーを修正する必要はない。ユーザーにとって本当に役立つものだけを修正すべきである。

簡潔にまとめるとこうなります。

  • 404 を返すべきでない URL(本当は存在するはずで、200 を返し正常に表示されるべきページ)→ 早急な修正が必要
  • 404 を返しても問題ない URL(すでに存在しないページ)→ 2 パターンの対応が考えられえる
    • 存在しないとはいえ、役に立つかもしれないページ → たとえば関連性のあるページにリダイレクト
    • ユーザーに見せる必要が本当にないページ → 対処不要。404 を返したままでいい

404 エラーがサイトに与える悪影響

本来表示されるべきページの URL が 404 を返してしまっていたら、もちろん悪影響が出ます。
検索結果から消えてしまうだろうし、ユーザーも当然閲覧できなくなります。
早急な修正が求められます。

一方で、削除したページのように提供する必要がなくなったページの URL が 404 を返すのはまったく問題ありません。
存在しないページ(正確には「見つからないページ」)が 404 を返すのはウェブの規則です。
むしろ、404 を返さなければなりません。
📝すずき補足:定義上は、削除した URL は 410 で、見つからない URL が 404 だけれど、今の Google は両者を区別しない

こうしたことも含めて、404 の Google の扱いについては公式ブログに解説記事があります。
10 年以上前に公開された記事ですが、今でも適用できます。
📝すずき補足:ウェブマスターツールや Fetch as Googlebot のような旧ツールが登場しているが、それぞれ Search Console と URL 検査ツールに置き換える

404 でも再クロールを繰り返すが

SEO に詳しい人は、イリース氏が説明した 404 の対処方法は目新しいものではないでしょう。

しかし、この投稿に書き込まれたコメントに対するイリース氏の返信で僕が知らないことがありました。

コメントでの質問は次のとおりです。

Google は、ページが 404 エラーであることを確認した場合、そのリソースを無駄にクロールしないよう、その情報をどこかに保存しているのでしょうか?自社のウェブサイトかすべての404エラーを削除することはできますが、もはや存在しないこれらのページへのリンクを持つ他のすべてのウェブサイトに対して、そのリンクを削除するよう依頼するのは少し難しいかもしれません。

イリース氏からの回答です

正確な回数は覚えていないし、調べるのも面倒だが、404 エラーの URL に対しては何度か試行した後であきらめ、新しく作成されたリンクを見つけるまでは再試行しない。少なくとも、僕の記憶では、そのように機能していたと思う。

たとえ、404(やその他の 4xx)エラーを URL が返していても、Googlebot は再クロールします。
エラーを返すのは一時的であって、その URL が復活しているかもしれないからというのが大きな理由です。

つまり、クロール頻度は落ちるものの、一度でも発見した URL は半永久的にクロールする……ものだと、僕は認識していました。
しかし、違っていたようです。

再クロールを何回か試みても 404 エラーが継続し、さらにその URL に向けて張られた新しいリンクを発見しない限りは、やがて再クロールも停止するとのことです。
きっと、完全に消滅したと判断するからでしょう。

この仕様に限っては初めて知りました。

#Google #SEO #404