HTTPSページを優先的に検索結果に表示するようにGoogleがインデックスシステムを調整

[レベル: 中級]

HTTPSページをデフォルトでインデックスするように検索の仕様を調整したことをGoogleはアナウンスしました。
たとえhttpsのURLにどこからもリンクされていなくても、そのページがhttpsでも接続でき、かついくつかの条件に当てはまる場合は、httpsのURLを検索結果に優先表示します。

HTTPとHTTPSの両方で接続できるならHTTPSを優先表示

たとえば、schema.orgは https://schema.orghttp://schema.org のどちらでもアクセスできます。

schema.orgはHTTPSとHTTPSのどちらでもアクセスできる

httpsへリダイレクトしていないし、rel=”canonical”でhttpsに正規化もしていません。

検索結果では https://schema.org のURLが表示されます。

検索結果ではhttps://schema.orgを表示

もっともschema.orgの場合はHTTPSでどこかからリンクされているのでGoogleにとってHTTPSバージョンのURLを発見するのは容易です。

しかし今回のインデックスシステムの変更は、たとえHTTPSバージョンへのリンクがどこにも存在しなかったとしても、httpsのURLにもGoogleは接続を試みます。
そしてHTTPSでアクセスでき、条件を満たせば、httpsのURLをインデックスし検索結果に表示します。

HTTPSでインデックスする条件

一般的に、次の条件にHTTPSページが当てはまる場合はhttpsでインデックスします。

  • 安全でない要素を含んでいない(すずき補足: たとえば、ページはhttpsだけれど画像やJavaScriptをhttpでダウンロードさせているの場合は対象外)
  • robots.txtでブロックされていない
  • 安全でないHTTPページへ、あるいは安全でないHTTPSページ経由でユーザーをリダイレクトしていない
  • HTTPページへ向けたrel=”canonical”を設置していない
  • noindex robots meta タグを含んでいない
  • HTTPのURLへ向けた内部リンクがない(すずき補足: on-host links は internal links のこと)
  • サイトマップにHTTPSのURLが記載されている、またはHTTPバージョンのURLが記載されていない
  • サーバーが有効なTLS証明書を所有している

【UPDATE】日本語版公式ブログで翻訳記事が出ました。これらの条件は公式記事でも確認できます。

再確認しておきますが、301リダイレクトやrel=”canonical”でHTTPSに正規化しているなら、httpsのURLで当然インデックスします。
これは今までどおりです。

httpsでもhttpでもどちらでもアクセスでき、上で示した条件に当てはまる場合はHTTPSバージョンを優先してインデックスするというのが今回の調整です。
たとえHTTPSバージョンのリンクがウェブのどこに存在しなかったとしてもです。

どのURLに対してもHTTPSでの接続を常にGooglebotが試みると考えてください。

ランキング変動は起きるか?

ランキングに与える影響に関してはアナウンスでは何も言及していません。

HTTPSがランキング要因になっています。
今回のインデックス仕様の変更によって検索結果に表示されるHTTPSページが増えてくるはずなので、ひょっとしたら変化があるかもしれません。
とはいえ、HTTPSアルゴリズム自体の影響力が微小なので変化があったとしても一般ユーザーが気付くほどではないでしょう。

なお、僕のブログのように意図して常時HTTPS化しているサイトには今回の変更はなんら影響しません。
httpsページでインデックスされるように、通常はHTTPSへ301リダイレクトで正規化しているはずです。

HTTPSとHTTPの両方でアクセスできる状態はセキュリティやプライバシー保護が万全だとは決して言えません。
事実、公式アナウンスではHSTSの構成を推奨しています。

今回の調整はランキングアルゴリズムの変更ではなく、安全なページを検索結果でユーザーに届けることを目的としています。
ウェブのセキュア化を促進するGoogleの取り組みの一環です。