rel=canonicalタグによくある5つの間違い

[対象: 中〜上級]

rel=”canonical”タグの正しい使い方とよくある間違いについて英語版のGoogle Webmaster Centaral ブログが説明しました。

最近は、日本語版のウェブマスター向け公式ブログの翻訳記事の公開のスピードが早いことが多いので近いうちに日本語でも読めると思います。

ですが、負けたくない早く共有したいので紹介します。
ただし「よくある間違い」については意訳になっているので全訳は日本語版ブログでの公開を待ってください(とはいえ、重要な点はきちんと説明しているのでご安心を)。

ではスタートです。

推奨されるrel=”canonical”のベストプラクティス

  • 重複するページの大部分のコンテンツが正規化バージョンのページに存在すること
    ヒント: そのページの言語が分からないと仮定して、重複ページを正規ページの隣に並べて置いたとき重複ページに書かれている単語のほとんど大部分が正規ページに出現しているか? ページの内容が似ているかを理解するためにその言語を話す必要があったとして、たとえば局所的に似ているだけで単語レベルで非常に一致していると言えなければ、canonicalの指示は検索エンジンに無視されるかもしれない。
  • rel=”canonical”の対象ページが存在するか二重にチェックする(エラーページであったりソフト404であったりしてはならない)。
  • rel=”canonical”の対象ページがnoindex robots meta タグを含んでいないことを確認する。
  • rel=”canonical”で指定したページが検索結果に表示させたいページであることを必ず確かめる(重複するページのURLであってはならない)。
  • rel=”canonical”は<head>に入れるかまたはHTTPヘッダーに含める。
  • 1つのページに記述するrel=”canonical”は1つだけ。2つ以上あった場合はすべてのrel=”canonical”無視される。

rel=”canonical”によくある5つの間違い

間違い その1: ページ分割した1ページ目にrel=”canonical”を向ける

一連のコンテンツをページネーションで複数のページに分割した状況で、2ページ目とそれ以降のページをrel=”canonical”で1ページ目に正規化するのは正しい使い方ではない。
ビューオールページかrel=”prev/next”の構成を採用する。

※鈴木補足: 詳細は過去記事を参照してください。

間違い その2: 誤って完全URLが相対URLとして書かれている

<link>タグは相対URLも完全URLもサポートしている。

下のどちらも受け入れられる。

<link rel=canonical href=“/cupcake.html” /> <link rel=canonical href=“http://example.com/cupcake.html” />

しかし、<link rel=canonical href=“example.com/cupcake.html” />と記述する(http://がない)と http://example.com/example.com/cupcake.html を意味することになってしまう。
この場合、アルゴリズムはrel=”canonical”を無視するかもしれない。

※鈴木補足: 完全URLと相対URLについては過去記事を参照してください。

間違い その3: 意図せぬrel=”canonical”と複数記述されたrel=”canonical”

サイト運用者が意図していないrel=”canonical”が記述されていることがある。
よくあるのはページのテンプレートをコピーしてrel=”canonical”を修正せずに、そのテンプレートの作成者のサイトに正規化してしまうこと。

もう1つの問題は異なるURLに向いた複数のrel=”canonical”が入っていること。
デフォルトのrel=”canonical”を挿入するSEO用のプラグインと連動して発生することが多い。
サイト管理者が気付いていないことがある。
このような複数のrel=”canonical”タグはすべてGoogleに無視されるだろう。
rel=”canonical”が持つ正規の利点はすべて失われる。

ページのソースコードを入念にチェックしておくこと。
複数のrel=”canonical”があった場合でも、離れていることがあるので<head>セクション全体を見る。

間違い その4: 注目記事を指すカテゴリページ/ランディングページ

たとえば、デザートのサイトを運用していて、「ペーストリー」と「ジェラート」のカテゴリページページがあったとする。
そのカテゴリページは、どれか1つの記事を注目ピックアップとして毎日取り上げている。
ある日の注目ピックアップが「レッド ベルベット カップケーキ」だったとする。
そうするとカテゴリページは、「レッド ベルベット カップケーキ」の個別ページと同じコンテンツになるから、「レッド ベルベット カップケーキ」の個別ページに向けたrel=”canonical”タグをカテゴリページに記述するかもしれない。

Googleがrel=”canonical”を受け入れたとすると、カテゴリページは検索結果に出てこなくなる。
rel=”canonical”は検索結果に出したい優先するURLを指示するものだからだ。

カテゴリページと注目ピックアップの個別ページの両方を検索結果に出したいなら、カテゴリページに自己参照のrel=”canonical”を記述する。
それ以外は何も記述しなくていい。

間違い その5: <body>内のrel=”canonical”

rel=”canonical”はHTMLドキュメントの<head>セクションだけに出現しなければならない。
またHTMLの読み取りの問題を避けるために<head>の先頭にできるだけ近いほうがいい。

<body>にrel=”canonical”が出てきたときは無視する。

まとめ

価値のあるrel=”canonical”を設定するためには以下に気を付ける。

  • 重複ページにあるメインコンテンツの大部分が正規ページにも出現することを確認する
  • (もし記述するなら)記述するrel=”canonical”はそのページの<head>内に1つだけ
  • 有効なコンテンツが有る存在するURLをrel=”canonical”が指し示していることを確認する(たとえば、404ページに向けてはいけないし、もっとよくないのはソフト404ページに向けること)
  • 注目ページが検索結果での優先URLになってしまうような、ランディングページやカテゴリページから注目ページに向けたrel=”canonical”を記述しない

僕にとってその4は初めて耳にした事例ですが、それ以外の間違った使い方は確かに多そうです。

導入当初と比べると誤用を随分と上手に判断できるようにGoogleはなってきました。
それでも設定する僕たちサイト管理者がrel=”canonical”の使い方を熟知していなければなりません。

rel=”canonical”の使い方の注意点についてはこちらの記事も参照してください。