SEOはテキストの最適化からエンティティの最適化へ at #SemTechBiz 2014

[対象: 上級]

SemTechBiz 2014 カンファレンスのセッションレポートの第2弾です。
Barbara Starr(バーバラ・スター)氏のセッションと2本立てで構成された、Bill Slawski(ビル・スロースキ)氏によるセマンティック検索をテーマにしたもう1つのセッションになります。

Semantic Search by  and Barbara Starr & Bill Slawski

テキストを対象にしていた昔のSEO

サイトの運営を自分が初めて始めた2005年当時のSEOは、titleタグやh1タグのようなタグで”テキスト”を対象にしたSEOだった。

その当時のSEOのチェック項目

  • URL構造
  • 情報設計
  • ページにおけるキーワードの使用
  • サイトスピード
  • 正規化 など

エンティティが加わった現在のSEO

エンティティに対するSEOが今は加わった。

エンティティのチェック項目

  • サイトにどんなエンティティが現れているか
  • 会社名やドメイン名でどんなふうにサイトが検索結果に表示されているか
    • スニペット
    • サイトリンク
    • ナレッジグラフ
    • ワンボックス
  • 関連するエンティティ
  • 世の中に新たに出てきたエンティティ
  • 同じだったり似ていたりするが、無関係のエンティティ
  • ナレッジベースへの登録
Bill Slawski speaking at SemTechBiz 2014

検索結果のエンティティ

“What movie does Robert Duvall love the smell of napalm in the morning in?”(ロバート・デュヴァルが、ナパーム弾の臭いを朝に嗅ぐのが好きだった映画は何?)で検索すると、該当する Apocalypse Now(日本語名: 地獄の黙示録)という映画が検索結果に表示される。

What movie does Robert Duvall love the smell of napalm in the morning in? の検索結果

Googleが認識しているエンティティ・事実

  • Actor(俳優): Robert Duvall
  • Known for(〜で知られている): love the smell of napalm in the morning in
  • Is A(…は〜である): Movie

検索クエリに含まれるエンティティ

“seobythesea patent”で検索すると上位15の結果はすべて自分(ビル・スロースキ)のサイトのページ。

seobythesea patent の検索結果

「seobythesea」が、SEO by the Sea というエンティティ(ウェブサイト)を意味するとGoogleが認識している。

ナレッジグラフのエンティティ

“Abraham Lincoln”で検索するとリンカーンの生年月日や身長、関連する人(George WashingtonやJohn F. Kennedy)がナレッジパネルに表示される

Abraham Lincolnの検索結果に出てくるナレッジグラフ

リンカーンがエンティティ(人物)だということとリンカーンに関する事実、関係するエンティティをGoogleは認識している。

関連するエンティティ

Tom Cruise movie(トム・クルーズ 映画)で検索すると関連するトム・クルーズの映画がカルーセルとして表示される。

Tom Cruise movie で出てくるカルーセル

エンティティの監査

Wikipediaの利用

  • 自分のサイトに登場しているエンティティを調べる
  • そのエンティティに関係する属性情報をWikipediaで調べる
  • 関係するエンティティとその情報をWikipediaで調べる

Googleは、主要なデータソースとしてWikipediaからエンティティや事実を抽出している。
したがってWikipediaは、そのエンティティに関する事実とそのエンティティに関連するエンティティを調査できる重要なリソースである。

検索結果で適切なエンティティとして表示されているか調べる

  • サイト名とドメイン名でのサイトリンク
  • ナレッジグラフの情報
  • ローカルリスティング

エンティティ監査のケーススタディ

アパートを仲介する不動産サイトがエンティティとして適切に認識されていないことを検索結果で発見した。
ホテルサイトと混同されて、ホテル関連の検索でローカル結果に出ていた。

そこで、エンティティ調査によって次のように対処した。

  • ビジネスモデル(ホテルではなくアパート斡旋)を、より明確にしてコンテンツを作った
  • 情報設計やナビゲーションを整えた
  • FAQコンテンツ(例: 近くの学校や幼稚園・保育園の情報)を作った
  • そのほかの潜在的な利点や問題点(交通機関)の情報を提供した

結果

ホテルのローカル結果に出なくなった。
より多くの地理的情報が加わった。
交通の便が良いことを表現できた。
学校や託児施設が必要なことがわかった。
プール付きかどうかなどアパートを借りたい人が知りたい情報がわかり、それらを付け足した。

セマンティックのレイヤーをウェブに追加すると、そのサイトが語ることとそこで得た経験を加えることができる。

以上です。

ビルとはGoogle+で日頃からやりとりしていましたが、実際に会うのは初めてでした。
見た目という点でいうと、エレガントなバーバラさんとは違っておっさん。
オタク系の印象でした。w

バーバラさんとビルと鈴木謙一

でも、もちろんそれは見た目の印象であって知識はやはり目を見張るものがありました。

ウィキペディアを利用したエンティティ最適化というのは面白い方法ですね。

ナレッジグラフからわかるように、Googleはウィキペディアをエンティティの抽出元(の1つ)として利用しています。
したがって、ウィキペディアを調べれば、Googleが認識しているエンティティが何かとそのエンティティに関わる事実が何かを知る手がかりがつかめるというわけです。
これをコンテンツ作成に利用するのです。

気を付けたいのは、Googleの評価を上げるためにエンティティを最適化するということではなく、ユーザーの役に立ち喜ばれるコンテンツを作るためにウィキペディアを利用し、結果としてエンティティ最適化に繋げるという点です。

検索エンジンにとってテキストが重要なのは今も変わりません。
しかしセマンティック技術の発展で、これからはエンティティに対する最適化もSEOでは大切な要素になってきそうです。