Googleが4月に実行した検索品質改善は52個 〜 フレッシュネス・アルゴリズム改善、メガサイトリンク改良、スペルミス修正など

[対象: 全員]

Googleは、4月に実行した検索品質を改善するため52個の改良・変更を英語版ウェブマスター向け公式ブログで公開しました。

毎月の恒例となっているSearch quality highlights(サーチクオリティ・ハイライト)シリーズの4月度版になります。

改良・変更の内容は次のとおりです。
同じカテゴリの項目が散在していますが、照らし合わせやすいように順番を変えずに元記事どおりに進んでいきます。

ページ分割されたドキュメントのカテゴリ化

[ローンチ・コードネーム: Xirtam3 / プロジェクト・コードネーム: CategorizePaginatedDocuments]
ページネーションで分割されたページで検索結果が占領されないようにし、より多様な結果を表示するようにした。

言語により関連したナビゲーショナル検索結果

[ローンチ・コードネーム: Raquel]
ナビゲーショナル検索(Navigational Query)は、特定のサイトを探す検索。たとえば「三井住友銀行」や「iPhone」。しかし同じナビゲーショナル検索でも言語によって違ったページを返したほうがふさわしい場合もある。この変更により言語を考慮したより適切なナビゲーショナル検索の結果を返すようになった。

ウェブページの対象国識別

[ローンチ・コードネーム: sudoku]
サイトやサブドメイン、ディレクトリがどの国のユーザーを対象にしているかを検出するシステムを持っているがページ単位にまで精度を上げた。たとえばUGC系のサイトでは、あるページをフランスに関連付ける一方で別のページをスペインに関連付けるかもしれない。

アンカーのバグ修正

[ローンチ・コードネーム: Organochloride / プロジェクト・コードネーム: Anchors]
アンカーの処理に関するバグを修正した。

より多様性に富んだドメイン

[ローンチ・コードネーム: Horde / プロジェクト・コードネーム: Domain Crowding]
検索結果が同じドメインからのページばかりになることがある。この改良によりさまざまなドメインからのコンテンツを検索結果に表示することがある。

組織からのより多くのローカル検索結果

[ローンチ・コードネーム: ImpOrgMap2]
自分の国にある組織のウェブサイトをより探しやすくした。

ローカルのナビゲーショナル検索の改良

[ローンチ・コードネーム: onebar-l]
場所を示すキーワードが含まれている場合、その地域にある店舗や会社などのホームページを1位に出すようにした。目的としているページが場所に言及していなくても当てはまる。

ランキングにおける検索キーワードのスコアリングの改善

[ローンチ・コードネーム: Bi02sw41]
検索キーワードがどのようにページに出現しているかは検索に用られるもっとも基本的な指標の1つ。この変更で検索キーワードのスコアリング方式を改善した。

スニペットの主要点の無効化

[ローンチ・コードネーム: DSS / プロジェクト・コードネーム: Snippets]
スニペットを生成するシステムを更新し他のインフラストラクチャと一貫性を保つようにした。単純化しスニペットを生成するプロセスにおける一貫性を向上させた。

ページの始めの方のテキストからのスニペット

[ローンチ・コードネーム: solar / プロジェクト・コードネーム: Snippets]
特に関連性が高いと判断したときは、ページの始めの方からより多くのテキストをスニペットとして表示する。

最新の結果に対するより速やかなランキング変更

[ローンチ・コードネーム: sep / プロジェクト・コードネーム: Freshness]
より最新のコンテンツを上位に出すための分類子の精度を上げ、タイムリーさに基づく検索に微妙なランキング変更をもたらした。

タイムリーさのシグナルの改善

[ローンチ・コードネーム: citron / プロジェクト・コードネーム: Freshness]
最新のドキュメントをより適切に識別することに役立つ、タイムリーさを評価するシグナルの1つに改良を加えた。

低クオリティのコンテンツは最新でも上位表示しない

[ローンチ・コードネーム: NoRot / プロジェクト・コードネーム: Freshness]
特に質が低いと判断したコンテンツは最新であっても新しさを評価する検索で上位に表示しないようにした。

インスタント・プレビュー開始動作の調整

インスタント・プレビューが作動する範囲を狭めた。検索結果の右端にある矢印アイコンにマウスを乗せてしばらく待つとインスタント・プレビューが出てくる。これまではもっと大きな範囲にマウスを乗せるだけで出てきた。

日の出・日の入 表示の国際化

[ローンチ・コードネーム: sunrise-i18n]
新たに33の言語で日の出・日の入の時間を調べられるようにした。

トルコの通貨換算機能の改善

[ローンチ・コードネーム: kur / プロジェクト・コードネーム: kur]
トルコの通貨換算機能を改善した。

セルビアのニュース検索のクラスタリングの改善

[ローンチ・コードネーム: serbian-5]
セルビアのニュース検索でキリル語とラテン語で書かれた記事をまとめて表示する機能を改善した。

より適切なクエリ解釈

直前の数回の検索をもとにユーザーの検索意図(インテンション)をより適切に解釈できるようにした。

ニュースのユニバーサル検索結果の改善

[ローンチ・コードネーム: inhale]
システムアーキテクチャをさらに統合することでニュース結果の提供を効率化した。

注目トピックのニュースに対するUI改善

[ローンチ・コードネーム: Smoothie / プロジェクト・コードネーム: Smoothie]
注目の話題について検索したときのユーザーインターフェイスを改善した。2つの結果とともに大きなサムネイル画像を頻繁に見ることができる。

ローカル検索のより広範囲な予測

[ローンチ・コードネーム: Autocompletea]
米国でのロングテールのローカル検索に対して、オートコンプリートで予測する範囲を拡大した。

パブリックデータ検索機能の開始の改善

[ローンチ・コードネーム: Plunge_Local / プロジェクト・コードネーム: DIVE]
パブリックデータを検索する機能を稼働させる仕組みを改善した。

エラーページの分類子を日本語と韓国語に追加

[ローンチ・コードネーム: maniac4jars / プロジェクト・コードネーム: Soft404]
ソフト404を識別するため仕組みを日本語と韓国語にも拡大した。ソフト404は(HTTPステータスコードの200を返すが)「ページが見つかりませんでした」のようなメッセージだけを返すページ。ユーザーがこういったページを探すことはほとんどありえない。

titleタグ置き換えのより効率的な生成

[ローンチ・コードネーム: HalfMarathon]
検索結果のtitleタグを生成するためにさまざまな指標を使っている。この変更により質を損なうことなくCPUリソースの使用を多大に抑え、より効率的に処理できるようになった。

よりコンパクトで分かりやすいタイトル

[ローンチ・コードネーム: kebmo]
同じ内容であったとしても、より詳しい情報が分かりより簡潔なタイトルを検索結果に表示するようにした。

国際的な、不適切な「もしかして検索」の減少

[ローンチ・コードネーム: Potage / プロジェクト・コードネーム: Spelling]
「もしかして検索」により検索キーワードが不適切に修正されてしまうことがある。これを防ぐためのアルゴリズムがあり今回国際対応した。

スペルミス修正をさらに多くの言語でグローバル展開

[ローンチ・コードネーム: pita / プロジェクト・コードネーム: Autocomplete]
オートコンプリート機能は入力が完了する前にスペルミスを修正してくれることがある。英語で提供してきたが60以上の言語に拡大した。

長いクエリのスペルミス修正

[ローンチ・コードネーム: caterpillar_new / プロジェクト・コードネーム: Spelling]
10語以上のような、より語数の多い検索キーワードでもスペルミスを修正できるようにした。

「次の検索結果を表示しています」の明示の国際化

[ローンチ・コードネーム: ifprdym / プロジェクト・コードネーム: Spelling]
「pnumatic」と間違ってタイプしたときに自動的に正しく修正して「pneumatic」の検索結果を表示するような場合がある。これまでは必ずしも、“Showing results for pneumatic”(“pneumatic”の検索結果を表示しています)や“Search instead for pnumatic.” (元の検索キーワード: pnumatic)と表示しなかった。英語においてはもっと頻繁にこれらのメッセージを明示的に表示するようにした。他の言語にも拡大中。

「もしかして」の抑制の国際化

[ローンチ・コードネーム: idymsup / プロジェクト・コードネーム: Spelling]
「もしかして」検索は正しいスペルを予測して修正する機能だが、修正後の検索結果が修正前とほとんど同じで役に立たないこともある。今回の変更では、修正後の結果をユーザーに見せる前にスペル修正が役に立つかをチェックする。このアルゴリズムは英語ではすでに導入が完了しており現在は他の言語にも展開している。

スペリングモデルのリフレッシュとクオリティ向上

27の言語でスペリングモデルを新たにし質の向上を図った。

低クオリティの結果に繋がるオートコンプリート予測の減少

[ローンチ・コードネーム: Queens5 / プロジェクト・コードネーム: Autocomplete]
質の低い検索結果に繋がるオートコンプリートの予測の表示が少なくするために設計された変更を導入した。

ビデオと画像のセーフサーチの改善

[プロジェクト・コードネーム: SafeSearch]
動画検索と画像検索におけるセーフサーチのシグナルを改善した。探していないときはアダルト結果が少なくなる。

改善されたセーフサーチモデル

[ローンチ・コードネーム: Squeezie / プロジェクト・コードネーム: SafeSearch]
セーフサーチの対象ページをカテゴリ化するために使っている分類子を40位上の言語で改善した。

ロシア語でのセーフサーチのシグナルの改善

[プロジェクト・コードネーム: SafeSearch]
ロシア語で、探していないときはアダルト結果の表示が少なくなった。

ベース インデックス サイズを15%増加

[プロジェクト・コードネーム: Indexing]
ベースインデックスは検索結果を返すのにメインとなるインデックス。Googleで行われるあらゆる検索はベースインデックスが参照される。今回の変更によりベースインデックスが提供するドキュメントの数が15%増える。なお別のインデックスのサイズを絶えず調整しており必ずしも変更がブログで発表されるとは限らない。

新たなインデックスの階層

[ローンチ・コードネーム: cantina / プロジェクト・コードネーム: Indexing]
インデックスは階層に分かれており、ユーザーにどのくらい関連性があるかによってさまざまな割合でさまざまなドキュメントがインデックスされる。4月に層を1つ追加し検索検索での包括性を続けてサポートしていく。

提供システムのバックエンドの改善

[ローンチ・コードネーム: Hedges / プロジェクト・コードネーム: Benson]
検索検索を提供するシステムの改善をいくつか行った。コンピュータのパワーの消費を抑えコードがきわめてシンプルになった。

拡張サイトリンク内のサブ・サイトリンク

[ローンチ・コードネーム: thanksgiving]
通常のスニペットの代わりにサブサイトリンクを表示することでメガサイトリンクに掘り下げた。

拡張サイトリンクのより適切なランキング付け

[プロジェクト・コードネーム: Megasitelinks]
通常のランキング付けで同じURLに対して使われるスコアに基づいた最小のスコアをサイトリンクに付与することでメガサイトリンクのランキング付けを改善した。

サイトリンクデータのリフレッシュ

[ローンチ・コードネーム: Saralee-76]
もっとも関連性の高いリンクをユーザーに見せるためにサイト構造や他のデータを分析するオフラインの処理でサイトリンクの一部は生成される。オフライン処理によるデータを先日更新した。なおこの更新は頻繁で2、3週間ごとに行われる。

拡張サイトリンクでの重複したスニペットの削減

[プロジェクト・コードネーム: Megasitelinks]
拡張サイトリンクでのスニペットが重複するのを減らすための新しい技術を採用した。

中国と韓国、日本のモバイル検索における映画上演時間の検索

映画の上演時間の検索機能を中国と韓国、日本にも拡大した。

MLB検索機能

[ローンチ・コードネーム: BallFour / プロジェクト・コードネーム: Live Results]
メジャーリーグベースボールの新しい検索機能を始めた。

スペインサッカー(La Liga)の検索機能

スペインサッカーの得点とチーム情報を提供するようになった。

Formula 1 の検索機能

[ローンチ・コードネーム: CheckeredFlag]
F1レースの情報を見つけやすくする新しい機能を導入した。

NHL検索機能の微調整

NHL検索の機能を改善した。

キーワードスタッフィング分類子の改善

[プロジェクト・コードネーム: Spam]
キーワードの乱用を識別する仕組みを改善した。

より多くのオーソリティ結果

オーソリティのあるコンテンツを上位に表示させるためのシグナルを調整した。

モバイルでのより優れたHTML5リソースキャッシング

さまざまなコンポーネントから成る検索結果ページのキャッシングを向上させた。多くのケースで遅延が劇的に減少した。

下の2つは個別に公式アナウンスされた改善です。
ともに僕が書いた記事で解説しています。

以上です。
4月の改良・変更は気にかけたいものがいくつかあるもののどれも重要度がそれほど高くないように思えます。
もっともペンギン・アップデートという一大アルゴリズム更新があったのも4月ですけどね。