[レベル:全員]
Google社員のJohn Mueller(ジョン・ミューラー)氏が開いたGoogle+でのHangout(ビデオチャット)に先週も参加しました。
今回もいくつか質問ができたので、前回のようにシェアします。
今日シェアするのは2つです(3つ質問できたけど、1つは特殊な問題なので割愛)。
404エラーは本当に無視していいのか
僕 (以下、KS):通常、404エラーで悪い影響が起こることはないと聞いている。でももし404エラーで悪影響が起こるとしたらどんなケースがあり得る?
John Mueller氏 (以下、JM):たとえばトップページが404を返している場合は、悪影響があるだろう。またサイト内の大量のページが404エラーを返したとしたら、クローリングのためのリソースを消費してしまいクロール効率が低下するかもしれない。
KS:Googleウェブマスターツールで大量の404エラーがレポートされている。それらのページはもう存在しないのだけれどなかなか消えなくて困っている。これって本当に無視して構わない?
JM:それらのページが本当に存在しなくて確実に404を返しているなら無視して大丈夫だ。
KS:うん、もうなくなってる。404も返してる。
JM:それなら気にしなくていい。404エラーはかなり長い時間、半年から1年くらい残ることもあるんだ。再びアクセスできる状態にそのページが戻っていないか、Googlebotが定期的にチェックするためだ。依然として存在しなければ404を検出したとレポートする。
HTTPステータスコードの404は、「Not Found」(ページが見つかりませんでした)のエラーを意味します。
サイト内に404エラーを起こすページが存在しても、ランキングやインデックスにマイナスな影響を普通は及ぼしません。
でも定期的なクローリングの起点となる、サイトのトップページが404を返していたら問題が発生しそうですね。
トップページからのリンクをたどって下層ページへもクロールするのに、そのトップページにアクセスできないということは他のページへのクロールにも支障が出そうです。
Googlebotが1回の訪問でクロールするページ数には限度があります(すべてのページをものすごいスピードでクロールすることは技術的には可能だけれど、そんなことをしたらサーバーがダウンしてしまうかもしれないし、ユーザーのアクセスを阻害してしまうかもしれない)。
1万ページとか10万ページも大量に404を起こすURLが存在していたら、エラーを起こすURLにクロールを試みてしまい正常なページへクローリングのリソースが割り当てられなくなってしまいそうです。
ということで、404エラーページの存在が大きな問題になることは通常はまずありませんが、ないに越したことはありません。
管理していな外部サイトからのリンクが原因で404エラーが起こっているのは対処できないとしても、サイト内の他のページからの内部リンクや自分が管理している外部サイトからのリンクが原因で404エラーが起きているときは、修正しましょう。
404エラーは検索エンジンだけではなく、存在しないページへユーザーを送ってしまうので不親切なことでもあります。
自力で修正できない404エラーページは無視して差し支えありません。
ところが404エラーを無視できるとして、Googleウェブマスターツールの「クロールエラー」セクションで「見つかりませんでした」、つまり404エラーを起こすURLがなかなか消えないことがあります。
気にしなくていいと分かっていても気持ちのいいものではありません。
しかもそのURLは明らかに存在しないのに残り続けます。
理由は、404を返していて見つからないページでもGooglebotが再訪問するためでした。
サーバーの不具合やサイト管理者の設定ミスで、不意に404エラーを返してしまうこともあるはずです。
たとえ404エラーを返したページでも、その後またアクセスできる状態に戻っているかもしれないのでGooglebotはアクセスしてくるんですね。
訪問するたびに404エラーを返すようなら、再訪問までの間隔はしだいに空いてきますが、完全に訪問しなくなるまでは1年くらいかかることもあるそうです(それでも忘れたころに突然やってくることがありそう)。
また他のサイトから間違ったURLでリンクが張られていたら、そのリンク経由で存在しないページにGooglebotがアクセスを継続しそうです。
Googleウェブマスターツールで「見つかりませんでした」エラーを出しているページが本当に存在しなくて404エラーまたは410エラーを間違いなく返しているなら、放っておきましょう。
404レポートを消すために、URL削除ツールで削除リクエストを送信してはいけないことは先日も説明しました。
エラーを起こしているURLをrobots.txtでブロックすることも不適切です。
robots.txtでブロックしたページにはGooglebotはアクセスできないので、404のステータスコードを返してもらえません。
したがって、存在しなくなっていることを知る術がなくなります。
“もやもや感”が残るかもしれませんが、ウェブマスターツールの「見つかりませんでした」は、そのページが存在しないことが確かなら見て見ぬふりをしていいということになります。
最後にMueller氏は、Googleのウェブマスター向け公式ブログで解説のあった404についての記事を紹介してくれました。
日本版の公式ブログでも翻訳記事が公開されているので、よく読んでおくことをお勧めします。
再審査リクエストの結果を教えてくれないのはなぜ
KS:再審査リクエストを送信して審査が終わった後は、ガイドライン違反が解消されて手動ペナルティが解除されたのか、それとも依然として残っているため引き続きペナルティを受けたままなのかを通知するようになったと、公式ブログでアナウンスがあった。でも結果を教えてくれない審査完了通知が届いている。結果が分からないから、どうすればいいか途方に暮れるんだけど。
Pierre Far氏:この通知機能はまだ実験段階で全ユーザーには送られていないんだ。
こちらは、ビデオチャットに参加していたもう1人のGoogle社員、Pierre Far(ピエール・ファー)氏にテキストチャットで回答してもらいました(今回のウェブマスター向けHangoutは、Google社員が2人もいる豪華版!)。
手動ペナルティを受けて再審査リクエストを送信し、再審査が完了するとウェブマスターツールに通知が送られてきます。
ガイドライン違反が完全に修正されたことを確認したのでペナルティを解除したか、またはガイドライン違反がまだ見られるためペナルティを継続しているかをウェブマスターに伝えるようになったと英語版のウェブマスター向け公式ブログがアナウンスしています(Web担当者Forumの連載コーナーで日本語解説してます)。
再審査リクエストの透明性を増すためです。
ところが、ペナルティが解除されたのかされていないのか分からない通知が今でも届きます。
We’ve processed your reconsideration request for http://www.example.com/
サイト http://www.example.com/ のインデックス登録の再審査リクエストを、サイト所有者から受け取りました。
サイトの再審査は完了しました。審査の際はサイトがウェブマスター向けガイドラインに違反しているかどうかを確認します。問題がない場合はサイトのインデックス登録を再検討します。引き続き Google の検索結果にサイトが表示されない場合は、ヘルプ センターで手続きを確認してください。
上は僕のクライアントさんが、9月6日に送信した再審査リクエストに対して、9月26日に受領したメッセージです。
結局どうなったのか、これでは分かりませんよね。
透明性が増したとは言い難いメッセージです。
ペナルティが解除されたことを伝える通知が届くことも確かにあります。
このサイトは以前、Google の品質に関するガイドラインに違反しているとの判断に基づき、Google Webspam チームが手動で対応しましたが、お送りいただいた再審査リクエストを検討した結果、この処理を取り消しました。なお、この処理の取り消し後、サイトが Google のインデックス登録と掲載順位システムに反映されるまで時間がかかる場合があります。
一部分だけですが、再審査リクエスト完了の通知には上のようなメッセージが含まれています。
解除した場合には解除をはっきり伝えるけれど、解除していない場合には“オブラートに包んだような”曖昧な言い回しにしているのか分かりませんが、結果を知ることができないのはストレスがたまりますね。
実験ではなくすべての再審査リクエストに対して、結果を教えてくれるようにしてほしいものです。
明らかなスパマーにはそんな親切なことをする必要はないですけどね。w
John Mueller氏によれば、ウェブマスター向けHangoutは、今のところ後から収録を公開する予定はないとのことでした。
Matt Cutts氏は、誰もが視聴できるウェブマスター向けライブQ&AをYouTubeで先日ライブ配信しました。
こちらは録画版を再生可能です。
これはこれでとても役に立ちますが、Google+でのHangoutは人数が10人に制限されている分、リアルタイムで直接やり取りができるのが嬉しい点です。