Googlebotは最初の15MBまでしかクロールしない制限はJavaScriptとCSSにも個別に適用される

[レベル: 上級]

Googlebot は、HTML ファイルの最初の 15MB までの部分をクロールし、15MB を超えた部分はクロールしません。

この制限が JavaScript や CSS にも適用されることが技術ドキュメントでより明確に記述されました。

JavaScript や CSS は HTML とは別々に取得される

この記事を書いている時点では、日本語ドキュメントは未更新です。
英語ドキュメントは次のように説明が変わりました。

▼変更前

Any resources referenced in the HTML such as images, videos, CSS, and JavaScript are fetched separately.

HTML で参照されるリソース(画像、動画、CSS、JavaScript など)は個別に取得されます。

▼変更後

Each resource referenced in the HTML such as CSS and JavaScript is fetched separately, and each fetch is bound by the same file size limit.

CSS や JavaScript のように HTML の中で参照されている各リースは個別に取得され、各取得は同じファイルサイズ上限に縛られます。

ものすごく明確になったようには思えませんが、以前よりは CSS と JavaScript に焦点が当たっています。

ようは大切なことは、HTML と CSS、JavaScript の合計サイズに 15MB 制限が適用されるのではなく、それぞれのファイルに対して個別に適用されるということです。

15MB を超える JS や CSS は稀だろうが一応注意

HTML ファイル単体で 15MB を超えるケースは極めてまれです。
同じように、JavaScript や CSS も単体で 15MB を超えることはそうそうないでしょう。
それでも、HTML ファイルよりはありえそうです。

Google のGary Illyes(ゲイリー・イリェーシュ)氏は、15MB 制限が JavaScript と CSS にも適用されることを LinkedIn で注意喚起しています。
そのなかで、15MB を超える JavaScript が実際にあると言及しています。

JavaScript と CSS だけではなく、Google 検索でインデックス対象になるテキストベースのファイル(たとえば、プログラミング言語のソースコード)にも 15MB 制限がかかります。

クロールされる必要があるテキストベースのファイルが 15MB 以下に収まっていることを、心当たりがあれば、念のため確認しておくといいでしょう。
特に、JavaScript と CSS には注意してください。
15MB を超えてしまった場合、適切にレンダリングされなくなる可能性があるのでランキングにも影響が及ぶことがあります。