RankBrainはロングテールによく機能するランキング要因、Googleは著者情報を完全に使っていないなどSEO最新情報 from #SMX Advanced 2016

[レベル: 初・中・上級]

お伝えしていたように、6月21〜21日に米シアトルで開催されたSMX Advanced 2016に参加してきました。

このカンファレンスの一番の目玉セッションともいうべき、”AMA With Google Search”をレポートします。
AMA With Google Searchは、主催者代表のDanny Sullivan(ダニー・サリヴァン)氏がさまざまな質問をGoogleのGary Illyes(ゲイリー・イェーシュ)氏にぶつけ、それにIllyes氏が回答するQ&Aセッションです。

ではいってみましょう!

ダニーとゲイリー
Danny Sallivan氏(左)とGary Illyes氏(右)

RankBrain

RankBrainは、本当にランキング要因なのか?
それともクエリの理解をより精錬するものなのか?

RankBrainはランキング要因。
RankBrainは、supervised learning(教師付き学習)のマシンラーニング(機械学習)。
[鈴木メモ: マシンラーニングをゲイリーは簡単に説明します。]

クエリに対してどんな検索結果が最も適しているかを判断する。
今までになかったクエリや特にロングテールクエリで特にうまく機能する

たとえば “can i beat Mario bros without using a walkthrough”(完全攻略ガイドなしでマリオブラザーズをクリアできるか)というクエリは、RankBrainがないと面白い結果になる。
RankBrainでより妥当な結果を出すことができる。

クエリに対してどの結果が適切かも判断する。

また、クエリの中の特定のワードも理解する。
たとえば、(マリオのクエリの例にある)withoutなどのように、除外してはいけないワードがわかりそれにふさわしい結果を取得する。

クエリの理解というよりも検索結果のスコアに影響する。
それに対して、ハミングバードはクエリにあるエンティティを理解する。
RankBrainは、より良い検索結果を生み出す。

RankBrainスコアというものはない。

RankBrainは新しい単独のシグナル。
検索結果で関連性をさらに高める。

RankBrainの最適化はできない。
自然な言葉で書くこと。
キーワードを詰め込んでも、いい結果にはならないだろう。
[鈴木メモ: RankBrainの最適化(ができない)ことは以前にも書きましたね。]

その存在が明らかになったとき、それまでに使われたことのなかったのクエリの15%をRankBrainが処理しているとのことだったが、今はどうなっているか?

今どうなっているかはわからない。
具体的な数字は知らない。

[鈴木メモ: Backchannelのインタビュー記事によれば、現在、RankBrainはすべて(ではないかもしれないが非常に多くの)クエリに関与しているとのことです。]

RankBrainが3番なら、コンテンツとリンクはどっちが1番なのか?

1番か2番かは、見方によって変わる。
(その質問に対する)完璧な回答を出すことはできない。

Google assistant

背後にあるのはマシンラーニング。
新しい試み。
何かができるか実験している最中。

マシンラーニングのアルゴリズム

どのくらいのアルゴリズムがマシンラーニングになっているのか?
すべてのアルゴリズムが機械学習のアルゴリズムに置き換わるか?

マシンラーニングは、検索に限らずGoogleにとって重要になってきている。
マシンラーニングにGoogleはフォーカスしている。
検索だけでなく、ほかのプロダクトにおいても何ができるかを実験してる。

検索において、マシンラーニングがどんなステージにあるかは言えない。

人間の手で書くアルゴリズムは今でも重要。
デバッグしやすい。

悪い検索結果があったとして、それがマシンラーニングアルゴリズムによるものだとしたら、(マシンラーニングは)はある種ブラックボックスみたいなものだから、どうしてそうなるのかわからないことがある。
だから、マシンラーニングで何ができるかに対してGoogleは慎重に取り組んでいる。

[鈴木メモ: ちなみに僕が事前にダニーに直接送っておいた質問(の1つ)です。名前付きで紹介してくれました。w]

ドメイン名

新しいgTLDは関係ない。

ccTLDはカントリーレベルでは影響する。

取得したドメイン(example.com の example)を見るケースもあるが通常は見ない。
影響力はとても小さく、期待するほどのものではない。

ドメイン名が役立つこともある。
ブランドやビジネスを反映するようにするべき。

xxx.newsドメインがnewsを含んでいるからといって「ニュース」で上位表示するべきかといったら、そんなことはないはずだ。

[鈴木メモ: 新しいgTLDが検索順位に影響しないことについては、こちらの過去記事を参照してください。]

検索アナリティクスのデータ期間延長

3年前から言い続けている検索アナリティクスのデータ期間延長はどうなっているのか?

今は、91日のデータを見てる(会場爆笑)。
どうやったら期間を伸ばせるかを考えている。
できる限り早くやりたいと思っている。

Search ConsoleとGoogleアナリティクスとの連携が強化した。Googleアナリティクスにデータを保存すればいいんじゃないか?

それはできない。

ペンギンアップデートの次の更新

間違ってばかりだから言わない。
ビジネスに対しても良くないと(ひとに)言われた。

パンダアップデート

パンダは、コアアルゴリズムに組み込まれた。
継続的に更新するがリアルタイムではない。
だいたい2、3か月に1回の間隔。
そのくらいの期間をかけてデータを集めて更新する。

[鈴木メモ:コアアルゴリズムに関してはこちらの記事を参照してください。]

HTTPSアルゴリズムの強化

正確な数字は覚えていないが、検索結果のだいたい30%くらいがHTTPS。
強化すべきかどうかを考えているが、すぐに強化するとは思わない。
関連性を犠牲にはしない。
慎重にやる。

次のモバイルフレンドリーアップデート

モバイルゲドンの名前はすごく嫌い。
[鈴木メモ: モバイルフレンドリーアップデートのことを業界では、「アルマゲドン (Armageddon)」にかけて「モバイルゲドン (Mobilegeddon)」 と呼ぶことがあります。僕も好きじゃないので、一度も使ったことはありません。]

次の(モバイルフレンドリーアップデートの)予定はない。
シグナルをもっと追加するかもしれない。
たとえばページスピード。
実際に実験している。
モバイルではPCよりもスピードがずっと重要。
ある時点でスピードがモバイルフレンドリーの要因になることを予期しておいたほうがいい。
[鈴木メモ: 楽天の宮田さんが、セッション後にゲイリーに直接質問したところ、モバイルランキング要因への表示速度の組み込みは年内にはないんじゃないかなとのことだったそうです。]

ソーシャルシグナル

いいねもリツイートも今でも使ってない。
ソーシャルシグナルを使うことには問題があった。
スパムがあるからということではなく、そのソーシャルネットワークがデータを利用させてくれなくなったら、ソーシャルシグナルを手にできなくなるから。
信頼性のあるシグナルが必要。

Google+

パーソナライズ検索に以前は大きく影響していたが?
今は違うように見える。

まだ出てるんじゃないかな?
ユーザーがエンゲージしないなら取り除く。
検索結果にあるものは変化する。

著者情報

著者情報は今はまったく使っていない。
In-depth articlesにも使っていない。
著者情報がなくても、たとえば書き方で誰が書いたかがわかる。
[鈴木メモ: 実際には「誰が書いたか」とは言わず、ダニーが書いたのかバリーが書いたのかを区別できるとたとえ話を出しました。理由は、タイポがあるかどうかで。なぜならバリーは高速を運転しながら記事を書くから(会場爆笑)。
なお著者情報は残しておいても構いませんが、残しておくことにまったく意味はないとのことです。SEO Japanの菅生さんがゲイリーにTwitterで質問していました。]

音声検索

音声検索のデータをどのように収集(提供)できるかを考えている。

タブ型コンテンツ

[鈴木メモ: ここからは参加者から投稿された質問です。]

タブ型コンテンツは好き?嫌い? やめたほうがいい?

好きだよ。たぶんそのままでいいんじゃない。

[鈴木メモ: ただし使い方には注意しましょう。]

A/Bテスト

A/Bテストがクローキングになるのではと不安。

何か月も何か月も、長い期間継続してはいけない。
妥当な期間で。
Googleが提供しているツールを使える。

検索結果のクリックデータ

検索結果への直帰やCTRをランキングに反省させているか?

クリックやCTRを特定の状況では使っている。
たとえばパーソナライズ。
「Apple」で検索したユーザーが会社のAppleの結果を繰り返しクリックするなら、そのうち会社のAppleをより上に表示するかもしれない。
実験でとても良い結果が出ている。

クリックの実験をやっている人がときどきいるが、Googleの実験と干渉してしまうことがあり迷惑。

RankBrainがロングテールに強い理由

RankBrainががヘッドタームよりロングテールに強いのはなぜか?

ロングテールの方が今までになかったクエリの傾向があるから。
収集したデータが十分でないと、いい検索結果が出せないことがある。
たとえば、リンクのように集まるのを待つ必要がない(リンクはただの例)。
RankBrainはクエリを見て、それが最適な結果だと判断できる。

HTTPSとHTTP/2

HTTPSやHTTP/2への移行をすすめるか?

まだ新しいからGooglebotはHTTP/2を適切に処理できない。
取組中。
それにブラウザも適切に扱えないことがある。
HTTPで代替する良い手段を準備しておくべき。
まだ急がなくていい。

HTTPSへの移行は強くすすめる。
ユーザーのことや整合性(たしかにそのサイトであること、改ざんされていないこと)をあなたがどのくらい気にしているかによる。
Let’s Encryptを使えば無料でできる。

コンテンツの次

良いコンテンツの次にすることは?

ユーザーが自分を知ってくれるようにする。
ソーシャルメディアを使う。
ユーザーが何を求めているかを見つけ出し、それを提供する。
そしてどれでもいいが、ソーシャルメディアを使う。
小さな会社が自分のプロダクトについての記事をソーシャルメディアで書いて数か月で百万のアクセスを達成したことを説明した記事があった。

UXに関しては、めちゃ速くする。
AMPは1秒以下だけどそういうのをユーザーは期待してる。

フッターリンク

フッターからのグループサイトへのリンクはペナルティを受けるか?

Amazonは複数の言語・地域のサイトにリンクしているが、そういうのは問題ない。
妥当な数ならいいだろう。
やり過ぎてはいけない。

インデックス

どうしてもインデックスされない。

インデックスされない理由としては、次のような理由によるものが多い。

  • nofollow
  • robots.txt
  • rel=”canonical”
  • クローキング

XMLサイトマップ

XMLサイトマップが大きいとインデックスされにくくなるのか?

XMLサイトマップのサイズはインデックスに影響しない。
ただしサイズ上限がある。

業種ごとのアルゴリズム

バーティカルに対してそれぞれのアルゴリズムを使っているのか?

ユニバーサル検索にはユニバーサル用のアルゴリズムがある。
クエリを理解して、画像あるいはニュースなどどれが適切かを判断する。

業種ごとに別々のアルゴリズムを使ってはいない。

モバイル専用インデックス

モバイル専用インデックスはどうなっているか?

開発中。

絵文字

タイトルの絵文字を表示しなくなったけど、また表示するようにするか?

しない。

アドバイス

最後にみんなにアドバイスしてほしい。
今後数年の間、意識を向けるべきことは何か?

AMPに注目する。
重要になる。

アシスタントとチャットにも注目。
大きな市場になる。
たくさんのひとがチャットに時間を費やしている。
うまく利用するといい。

以上です。

最後は、ダニーとゲイリーのセルフィーに写り込んで終了です。w

ダニーとゲイリーの自撮り