MicrosoftのOffice.comがサイトリニューアル時に実行したSEO向けのURL変更

Microsoft Office ロゴMicrosoftは、Office 2010 の発売を機にMicrosoft Officeのオフィシャルサイト Office.com のデザインを一新しました。

Office.comは、現在38言語に対応し600万ページを公開していて1ヶ月のユニークユーザーは2億を超えます。
世界で30番目に規模の大きなサイトに数えられます。

今回のリニューアルに際しては、外部のSEOベンダーにも協力してもらいSEOも十分考慮しました。

どのような施策を実行したのかをBingの公式ブログが紹介しています。
解説しているのは、Office.comが行った「検索エンジン フレンドリーなURL構成」の施策です。

Office.comは前述したように超大規模サイトですが、僕たちのSEOにも役立ちそうな情報が含まれているの今日はこの記事をピックアップします。

キーワードに基づいたウェブページのURL

Office.comは、これまではドキュメントのIDだけを含んだURLを使用していました。
CMSが管理するために生成したURLで、検索エンジンやユーザーのことは何も考慮に入れていません。
リニューアルにあたっては、ウェブページのファイル名にキーワードを含めるようにしました。

理由は以下のとおりです。

  • ユーザーがURLをそのままウェブページに貼ってリンクしたときにアンカーテキストの効果が見込まれる
  • URLにキーワードが含まれること自体がランキングにプラスに作用していそう
  • URLに検索キーワードが含まれていると検索結果で太文字強調される

そこで次のようなポリシーのもとにウェブページのURLを変更しました。

  • ページのタイトル(titleタグの記述)で始める
  • 空白スペースやアポストロフィ、アンダースコアなどの区切りはハイフンに置き換える
  • アクセント付き文字や拡張文字はプレーンなASCII文字に標準化する
  • すべて小文字を使う
  • 必ずユニークなURLになるように、タイトルにかかわらず、常に内部で使用するドキュメントIDを末尾に付ける

ただし数多くの言語で数十万のページをすでに公開しているため、展開のしやすさを考えてページのタイトルはそのままで変更してませんでした。

たとえば”Overview of XML in Excel”というタイトルのページの英語ページのURLは次のようになります。
http://office.microsoft.com/en-us/excel-help/overview-of-xml-in-excel-HA010206396.aspx

一方でメキシコのユーザー向けに対応させた同じコンテンツのページのURLは次のようになります。
http://office.microsoft.com/es-mx/excel-help/informacion-general-sobre-xml-en-excel-HA010206396.aspx

ページのファイル名にはそれぞれ英語とスペイン語のタイトルが含まれています。
しかし同じドキュメントなので、その後のID番号(HA010206396)は共通です。

ストップワードの処理

「the」「a」「for」などのようにそれだけでは特に意味を持たない単語をストップワード(stop words)と呼び、検索エンジンは検索の対象から外しています。

記事タイトルをページのURLにするときはストップワードを抜き取るサイトもあります。
理由はURLが長くなるのを避けるためです。
URLにキーワードがありすぎると個々のキーワードの価値が薄まったり、長いURLはクリック率が落ちるという分析もあります。

しかしOffice.comはストップワードをあえて取り除きませんでした。
理由は以下のとおりです。

  • サポートする言語の数が多いため手間がかかりすぎる
  • ストップワードであっても重要な意味を持つタイトルの場合があり、取り除く意味をなさなくなってしまう
  • 検索エンジンは検索結果でのウェブページのURL表示を改善し始めているので、以前よりもクリック率を気に掛ける必要がなくなってきた

キーワードをベースにしたURLの例外

ページのタイトルから付けられたファイルの名前を使わずに、フォルダ(Office.comでは「sub web(サブ・ウェブ)」と呼ぶそうです)の名前を固定のURLとして使用するケースがあります。

特定のカテゴリのトップページが例で、 http://office.microsoft.com/en-us/access-help/ というURLが該当します(ファイル名がなく、サブ・ウェブで終わっています)。

この形式は既定のインデックスページ(URLにファイル名を指定しないときに表示するページ)のIDが変わった時でもURLが変わらないので、古いページから新しいページへリダイレクトする必要がないという利点も生みます。

また日本語やロシア語、アラビア語、ヒンズー語のような非ラテン系の言語ではキーワードベースのURLを採用しませんでした。

技術的に実現が困難だったことに加えて、ユーザー・ブラウザ・検索エンジンに対してベストなURLの取り扱い方に不明瞭な点が残っているためです。

※以下、鈴木の補足
英語サイトとメキシコ向けサイトのURLの例に出た”Overview of XML in Excel”というタイトルのページのURLは、日本語では次のようになっています。

http://office.microsoft.com/ja-jp/excel-help/overview-of-xml-in-excel-HA010206396.aspx

ページタイトルは「Excel での XML の概要」ですが、URLのファイル名は「overview-of-xml-in-excel-HA010206396.aspx」で英語のURLと同じです。

キーワードベースのURLのポリシーに従えば「ExcelでのXMLの概要-HA010206396.aspx」になるはずです。

英語では、程度の差こそあれ、URLにキーワードを含めることはプラスに働くという意見が多いですが、日本語の場合はハッキリしませんよね。

Amazonや楽天はURLを日本語化しています。
ランキングに影響があるのかどうかともかくとして、検索結果やブラウザのアドレスバーに表示されるURLの視認性という点は役だっていそうですね。

なおOffice.comはIISの上で動くShare Pointというプラットフォームで構築されています。
このシステムのもとではURLの日本語化は難しいんですかね。

URLのパラメータを減らす

リニューアル時にキーワードベースのURLに変更したことに加えて、クエリパラメータの数を減らすことを押し進めました。
クリック率を測ったりするための一部の動的パラメータはそのままですが、全体として静的URLに変わっています。

パラメータを減らしたことで、検索エンジンが「主」となるURLを判断しやすくなっただけでなく、表面上URLだけが違うページのクロールや重複処理に費やす時間を少なくすることができ、その分の時間を他のページに当てられることを狙っています。

古いスタイルのページから新しいスタイルのページへのリダイレクトと正規化タグ

これまで積み上げてきたSEOの資産を引き継ぐために301リダイレクトで旧URLを新URLへすべて転送します。
バックアッププランとしてrel=”canonical”タグも導入しました。

301リダイレクトは、サーバーに与える負荷やリダイレクト実装後のインデックスやランキング、トラフィックの変化を調べるために段階を経て展開していく予定で、今は一部のURLに対してだけ適用しています。

今月の終りにはすべての古いURLを新しいURLに301リダイレクトするつもりです。

一方 rel=”canonical”タグはすでに全ページに実装されています。
301リダイレクトを利用していなくても正規化にどんな効果があるかのデータを取得中です。

また検索エンジンに新しいURLを伝えるために、新しいURLだけを記述したXMLサイトマップを送信しています。

※以下、鈴木の補足
このセクションを訳していて思ったことがあります。

Bingは301に関しては以前に比べたらずいぶんとうまく処理できるようになってきているようです(それでもまだ十分ではないみたいですが)。
でも rel=”canonical”タグに関してはまだまだぜんぜんダメですね。
記述していても正規化せずに重複URLが残ったままです。

Googleはほぼ問題なし、Yahoo!も処理できているようです。

Office.comのSEOを考慮したURLの変更には有益な情報が詰まっていたのではないでしょうか。
サイトリニューアルに限らず新しいサイトを構築するときにも役立ちそうな設定がありましたね。

Office.comのサイトリニューアルの紹介は次へ続いて、今度はXMLサイトマップの戦略を解説するそうです。
記事が公開されたらまた取り上げます。