noindexとrel=canonicalの両方が設定されたページをGoogleはどのように処理するのか?

[レベル: 上級]

noindex robots meta タグと rel="canonical" タグの両方が設置されたページを Google はどのように扱うのでしょうか?

定まっていない

もう 4 年も前になりますが、noindexrel="canonical" が同時に使われている場合の Google の処理を尋ねる質問が Reddit に投稿されました。

Google の John Mueller(ジョン・ミューラー)氏は回答の中で次のようにコメントしています。

noindexrel="canonical" の両方がある場合は)通常は、rel="canonical" を選択し、noindex よりも優先して利用する

rel="canonical" が優先されるというのです。
noindex が設定されているページは評価対象から外れると僕は理解していたので、ミューラー氏の説明は非常に意外でした。

そこで、直接聞いてみました。

ページ A に noindex と、ページ B を指定している rel="canonical" があるとき、ページ A の評価は ページ B に転送されるんですか? rel="canonical"noindex を 上書きすると言ってますよね?

ミューラー氏のこのように返答しています。

定まっていないと思う。

状況による

理由まではミューラー氏は述べていませんが、状況によるのだろうと推測します。

まず、noindexrel="canonical" のどちらが先に処理されるかが関わってくるでしょう。

noindex が先に処理されるのであれば、評価は転送されないはずです。

対して、rel="canonical" が先に処理されるのであれば、rel="canonical" が示す URL に評価が転送されそうです。
しかしながら、最終的には、noindex を認識することによって評価転送が中断されるかもしれません。

noindexrel="canonical" のどちらか、または両方を JavaScript で挿入している環境でも処理は異なってくるでしょう。
JavaScript の実行は、通常の HTML のレンダリングよりも後に行われるからです。

状況によって処理が一律ではないので、「定まっていない」とミューラー氏は返信したのだと思われます。

矛盾した設定をしない

noindex robots meta タグと rel="canonical" タグのどちらが優先されるかは興味がわく疑問ではありますが、実務上は重要ではありません。

重要なことは「矛盾した設定をしない」です。

noindex はインデックスするなという命令です。
単独で使われていれば、そのページが持つ評価を Google はすべて破棄します。

一方で、rel="canonical" は指定した URL に評価を移してくださいという依頼(📝すずき注: 命令ではない)です。
移すとは言え、評価します。

大雑把に言えば、「評価するな vs. 評価せよ」という相反する指示を同時に出しているわけです。

矛盾した設定をすべきでないのは、noindexrel="canonical" に限りません。
あらゆる構成に当てはまります。
こちらが想定したように処理されない可能性があります。
想定どおりに処理されたとしても、時間とともに処理が変化するかもしれません。

たとえば、URL の正規化も同様です。

  • あるページの内部リンクは http で、あるページの内部リンクは https
  • rel="canonical"http
  • サイトマップは https

これでは、httpshttp のどちらが正規 URL なのかがはっきりしません。
Google を混乱させます。

特に技術的な設定においては、一貫させることが大切です。