[レベル: 中級]
Google のキャッシュの説明に含まれる日時は、最後にインデックスされたときの日時を示します。
最後にクロールされたときではありません。
また、SEO のために利用するにはキャッシュは不向きです。
キャッシュの日付はインデックス日であってクロール日ではない
今朝方、Google の Gary Illyes(ゲイリー・イリェーシュ)氏が次のようなツイートを投稿していました。
キャッシュページに表示される日付について、ここ数週間ほどの間に何人かに尋ねられた。
明確にしておきたいのだが、その日付は、最後にインデックスまたは再インデックスされたときのものあって、最後にクロールされたときのものではない。Googlebot はページをクロールするかもしれないが、インデックス(のシステム)が、前のバージョン(のキャッシュ)を再利用しようと判断することがときにはある。
The past couple weeks a few people asked about the cache date shown on the cache pages. To be clear, that date is when the page was last indexed or reindexed, not when it was last crawled. Googlebot may crawl a page, but indexing may occasionally decide to reuse an older version. pic.twitter.com/QniOln4tZI
— Gary "鯨理" Illyes (@methode) 2018年8月6日
検索結果の「キャッシュ」リンクあるいは cache:
コマンドを利用することでそのページのキャッシュを見ることができます。
キャッシュページにはキャッシュの取得日が書かれています。
この日付のことをゲイリーは説明しているのです。
最終クロール日ではなく、最終インデックス日になります。
したがってクロールされたとしても、そのページの最新の状態がキャッシュには反映されていないことがありえます。
SEO にキャッシュページを使うべきではない
そもそも、SEO の分析を目的に利用するにはキャッシュページは適していません。
利用価値がまったくないということではありませんが、検索の仕組みに精通しているのでなければ不正確な情報を手にしてしまうことがあるからです。
ゲイリーが指摘した日付がその一例です。ほかには、キャッシュは Googlebot がレンダリングした結果ではないということを知らないのもありがちです。
キャッシュと Google のインデックスは別のデータです。
実際のインデックスは更新されていても、キャッシュは更新されていないということもありえます(新規ページで、本当はインデックスされているのにキャッシュを見られないということもある)。
日付を含め、キャッシュのデータを検索の診断に使うべきではないことをゲイリーもジョンもたびたび指摘しています。
そのようなこと(インデックスの更新頻度を知ること)にキャッシュ日を使うのは気をつけたほうがいい。日付はそういったことを示すものではない。
Not that I'm aware of — but I'd be cautious using the cache dates for anything like that, they're not indicative of that.
— John ☆.o(≧▽≦)o.☆ (@JohnMu) 2016年11月20日
インデックスしたページをすべてキャッシュ表示するとは限らない。キャッシュページが 404 を返すことがありうる。キャッシュページが表示されるまでにはしばらく時間がかかることがあるし、単にまったくキャッシュしないことだってある。
We don't cache all pages that we index, so that can happen. Sometimes it takes a while, sometimes we just don't cache it at all.
— John ☆.o(≧▽≦)o.☆ (@JohnMu) 2017年8月24日
キャッシュされないことの理由としては、重複や正規ページではないこと、noarchive が設定されていることに加えて、あらゆる種類の予想しない動きによるものがある。
キャッシュはいわば分離している。私たちがインデックスやランキング付けするものを何か指し示すものではない。
That + it can be all kinds of pages for weird technical quirks. The cache is kinda separate, so it's not indicative of what we index & rank.
— John ☆.o(≧▽≦)o.☆ (@JohnMu) 2017年8月24日
キャッシュの日付は診断ツールではない。(キャッシュ日が一致しなかったとしても)無視しなさい。
The date on that page isn't a diagnostic tool, ignore it :)
— John ☆.o(≧▽≦)o.☆ (@JohnMu) 2018年6月4日
キャッシュされたページがあるかないかは、何らかの特定の問題の兆候を示すものではない。キャッシュページが 404 を返してもまったく普通だ。心配しなくていい。
Having or not having a page cached is not a sign of any particular problem, that can be perfectly normal. I wouldn't worry about it.
— John ☆.o(≧▽≦)o.☆ (@JohnMu) 2018年7月29日
ということで、SEO の分析にキャッシュを使うのはやめましょう。