[対象: 上級]
2012年6月と7月に実行した検索品質改善をGoogleは検索向けの公式ブログで発表しました。
2ヶ月分まとめての発表で合わせて86項目になります。
今日と明日の2回に分けて6月分の59項目と7月分の27項目を紹介します。
なお名前が付けられているものはその名称がタイトルになっていますが、特に付けられていないものはID番号だけです。
2012年6月にGoogleが実行した59個の検索品質改善
uefa-euro1
[プロジェクト・コードネーム: Answers]
EURO 2012の試合のスケジュールと得点のライブの結果を表示する。
#82293
[プロジェクト・コードネーム: Answers]
より自然な言語での検索のためのサポートを追加することで辞書検索機能を向上させた。
Better HTML5 resource caching for mobile
[プロジェクト・コードネーム: Mobile]
検索結果ページのさまざまな要素のキャッシングを改善し、いくつかの状況で遅延を劇的に減少させた。
ng2
[プロジェクト・コードネーム: Other Ranking Components]
ランキング付けの主要な動作をいくつか組み合わせるための、新しいものと改良したランキングの機能を使用し1位の結果の順番を改善した。
Ref-16
[プロジェクト・コードネーム: Other Ranking Components]
インターナショナリゼーションを向上するための「公式ページ」アルゴリズムを変更した。
Bamse
[プロジェクト・コードネーム: Page Quality]
より品質の高いコンテンツを信頼できるソースから発見できるようにした。
※鈴木補足: このあとも出てくる「Page Quality」というコードネームが付く改善は名前に触れていなくてもパンダ・アップデート関連かもしれません。
Bamse-17L
[プロジェクト・コードネーム: Page Quality]
より品質の高いコンテンツを信頼できるソースから発見できるようにした。
※鈴木補足: 上と同じ説明です。この後も数回出てきます。
GreenLandII
[プロジェクト・コードネーム: Page Quality]
高品質なサイトとページをより適切に検出するためにパンダのアルゴリズムに新しいデータを組み込んだ。
※鈴木補足: これは「パンダ」に言及しています。
#82353
[プロジェクト・コードネーム: Page Quality]
パンダ・アップデートのデータを最新の状態にした。
※これも「パンダ」に言及しています。
SuperQ2
[プロジェクト・コードネーム: Image]
より本筋に合った画像結果を返すように画像検索のシグナルを1つ更新した。
#82743
[プロジェクト・コードネーム: Answers]
計算機機能を変更し「4 times 3 and a half」(3と2/1の4倍)のように「and」を含むクエリの認識力を向上させた。
komodo
[プロジェクト・コードネーム: Query Understanding]
より適切にロングテール検索を理解し検索するために使われるシステムのデータを最新にした。
#82580
[プロジェクト・コードネーム: Answers]
日の出・日の入時刻を表示する機能を改良した。
PitCode
[プロジェクト・コードネーム: Answers]
すでに導入済みのFormula1(フォーミュラ1)に加えて、Nascar(ナスカー)とMotoGP(モトGP)、IndyCar(インディカー)のライブ結果を追加した。
timeob
[プロジェクト・コードネーム: Answers]
“What time is it in India?”(インドは何時?)のような時間を調べる質問をより適切に理解するための自然言語の検出力を向上させた。
#81933
[プロジェクト・コードネーム: Synonyms]
ランキング決定における同義語の使用を向上させた。元の検索キーワードとは違う意味を持つ同義語の検索結果が減った。
#82496
[プロジェクト・コードネーム: Answers]
モバイル検索での映画の上映時間の検索を変更し自然言語クエリの検出力と全体的なカバー範囲を向上させた。
#82367
[プロジェクト・コードネーム: Other Ranking Components]
より品質の高いコンテンツを信頼できるソースから発見できるようにした。
※鈴木補足: パンダ関連っぽいけど別もの?
#82699
[プロジェクト・コードネーム: Other Search Features]
場所をすばやく比較することをより容易にした。ローカル結果にマウスを当てると右手側にその場所の情報が出てくる。
CapAndGown
[プロジェクト・コードネーム: Image]
多くのウェブページでは、もっとも重要なイメージはそのページの主題全体に密接に関連している。他とは際立っているそういった画像を見つけることにこのプロジェクトは役立つ。
#82769
[プロジェクト・コードネーム: Answers]
「4 times 3 divided by 2」(3かける4わる2)のように言葉と数字の両方を含むクエリの処理を向上するための、モバイルでの計算機機能を改善した。
Vuvuzela
[プロジェクト・コードネーム: SafeSearch]
動画検索モードと通常検索でのアダルトビデオコンテンツの処理を統合するためにセーフサーチを更新した。
#82537
[プロジェクト・コードネーム: Answers]
通貨換算機能における自然言語の検出を向上させ、”What is $500 in euros?”(500ドルはユーロだといくら?)のような質問をより適切に理解できるようにした。
#82519
[プロジェクト・コードネーム: Answers]
フライト検索における自然言語の検出を向上させ到着の時刻と状況についての検索をより適切に理解できるようにした。
#82879
[プロジェクト・コードネーム: Answers]
“When is Mother’s Day?”(母の日はいつ)のような「〜はいつ?」検索を発動する条件の検出を向上させた。
wobnl0330
[プロジェクト・コードネーム: Answers]
天気予報検索の表示を改善した。
Lime
[プロジェクト・コードネーム: Freshness]
最新のコンテンツを探す検索に対する検索結果を向上するためのさまざまな検索要素間における相互作用をこの変更は向上させた。
gas station
[プロジェクト・コードネーム: Snippets]
サイトリンクのタイトルにボイラープレートのテキストが使われないようにしてユーザーの役に立つ情報だけを保つようにした。
※鈴木補足: 「ボイラープレート」は「テンプレート」のこと。
#81776
[プロジェクト・コードネーム: Answers]
単位換算機能における自然言語の検出を向上させ、”What is 5 miles in kilometers?”(5マイルはキロメートルだといくつ?)のような質問をより適切に理解できるようにした。
#81439
[プロジェクト・コードネーム: Answers]
モバイルの音声検索でのファイナンス検索の表示を改善した。
#82666
[プロジェクト・コードネーム: Page Quality]
より品質の高いコンテンツを信頼できるソースから発見できるようにした。
※鈴木補足: パンダ関連?
#82541
[プロジェクト・コードネーム: Other Ranking Components]
ウェブ検索結果をクラスタリングするためのシステムをより良くかつよりシンプルにするために取り組んでいる複数のプロジェクトの1つ。
※鈴木補足: 「クラスタリング」は近い結果をひと塊にすること。
gaupe
[プロジェクト・コードネーム: Universal Search]
フライト検索の表示を改善した。「flights from Austin to London」(オースティンからロンドンまでのフライト)のように米国外の目的地が入るクエリの結果も今は表示する。
#82887
[プロジェクト・コードネーム: Answers]
辞書検索機能のための自然言語の検出力を向上させた。
gallium-2
[プロジェクト・コードネーム: Synonyms]
概念が内部に含む同義語をこの改良は向上させた。
zinc-4
[プロジェクト・コードネーム: Synonyms]
特定のケースでは、同義語のコンピュータでの処理によらない効率性をこの改良は改善した。
Manzana2
[プロジェクト・コードネーム: Snippets]
展開型サイトリンク機能のクラスタリングとランキングを改善した。
#82921
[プロジェクト・コードネーム: Alternative Search Methods]
モバイル検索で発話された、ファイナンスに関する情報を探す検索をより適切に理解できるようにしファイナンス結果を向上させた。
#82936
[プロジェクト・コードネーム: Answers]
天気予報検索の表示を改善した。
#82935
[プロジェクト・コードネーム: Answers]
日の出・日の入を知るための自然言語の検出力を向上させた。
#82460
[プロジェクト・コードネーム: Snippets]
この変更により、正確な検索結果のタイトルをより適切に生成するために同義語を使うようになった。
#82953
[プロジェクト・コードネーム: Answers]
天気に関するクエリの検出力を向上させた。
PandaMay
[プロジェクト・コードネーム: Search Quality]
高品質なサイトを評価するパンダ・アップデートのデータを最新にした。
※鈴木補足: パンダに言及。
ItsyBitsy
[プロジェクト・コードネーム: Images]
画像検索のクオリティを改善するために、ちっちゃかったり役に立たなかったりする画像を画像検索結果ページの下にフィルタリングした。
localtimeob
[プロジェクト・コードネーム: Answers]
現地時間検索の表示を改良した。
#82536
[プロジェクト・コードネーム: Answers]
スケジュールや最新の試合結果など、より適切にベースボールについてのクエリを理解しMLBについての最新のベースボール情報を返すための自然言語の検出を向上させた。
Improvements to Images Universal ranking
[プロジェクト・コードネーム: “Universal Search]
稀に検索されるクエリで画像のユニバーサル検索結果を表示する能力を大きく向上させた。
absum3
[プロジェクト・コードネーム: Snippets]
検索結果に表示するタイトルをより適切に選択することに役立つ。特に、非ラテン語系の言語のページに対するタイトルの改善に関係するアルゴリズム変更。
#83051
[プロジェクト・コードネーム: Answers]
モバイル利用の特定の状況でローカルビジネスの情報表示を改良した。具体的には、電話番号や住所、営業時間などローカルビジネス検索に関連する情報を強調するようにした。
calc2-random
[プロジェクト・コードネーム: Answers]
計算機を探すクエリの理解がこの変更で向上した。
#82961
[プロジェクト・コードネーム: Alternative Search Methods]
ある場所へまたはある場所からの目的地案内を開始地点を特定せずにモバイル端末で検索した場合、現在いる地点から出発した結果を返す。
#82984
[プロジェクト・コードネーム: Universal Search]
Google.comの英語の検索だけで利用できた画像のユニバーサル結果の機能のひとつが、すべてドメインのGoogleの英語の検索で利用できるようになった。
※鈴木補足: ユニバーサル検索結果で画像のサムネイルがタイル状に並びマウスカーソルを当てると拡大表示される機能など。
#82150
[プロジェクト・コードネーム: Spelling]
スペリングのシステムで使うアルゴリズムを8つの言語で更新した。
NoPathsForClustering
[プロジェクト・コードネーム: Other Ranking Components]
同じサイトや同じパス(最後の“/”までが同じURL)からの結果をクラスタ化するアルゴリズムが一貫性を保つようにしてきた。これはクラスタリングシステムをより良く、よりシンプルにするために取り組んでいる複数のプロジェクトの1つ。
※鈴木補足: 同一ドメインからの大量のページが検索結果を埋め尽くした元凶がこれか?
Hamel
[プロジェクト・コードネーム: Page Quality]
ユニークなコンテンツを持つハイクオリティなページを探すのを助けるために使うモデルの更新。
※鈴木補足: これもパンダ関連か?
#81977
[プロジェクト・コードネーム: Synonyms]
ユーザーが探していないアダルトコンテンツを返すことが少なくなるように同義語のシステムをアップデートした。
Homeland
[プロジェクト・コードネーム: Autocomplete]
検索者がいる国により関連したキーワードを予測できるようにオートコンプリートを改善した。
以下の2項目はすでに別途公式アナウンスがあった更新になります。
Flight Search for Canada
カナダのフライト検索導入。
– Introducing Flight Search for Canada
Updated Hot Searches list
米Google (google.com) のGoogle TrendsでのHot Searches(日本のGoogleトレンドの人気急上昇ワードに相当)の表示形式を変更。
– Find out what people are searching for with the updated Hot Searches list
毎月の恒例となっていた「Search quality highlights(サーチクオリティ・ハイライト)シリーズ」は先月は投稿がありませんでした。
フェードアウトするつもりかとも疑ったのですが2ヶ月分がまとめてきましたね。
数が多いせいなのか、これまでよりも説明が簡素になっています(訳す身としてはそのほうが楽だけどw)。
「補足」で触れたようにパンダ関連っぽい更新が8つありました。
しかしそのうち「Panda」という言葉を使っているのは、“GreenLandII”と“#82353”、“Hamel”の3つだけです。
公表されていた6月のパンダ・アップデート更新は、3.7と3.8の2回だけだったのに実際には少なくとも3回はあったことになりますね。
1つは確実に未公表だったことが明らかなので、Googleは僕たちに知らせずにもっと頻繁にパンダのアルゴリズムやデータを微妙に更新しているのかもしれません。
【UPDATE】
パンダに関連するように僕には思えたというだけで断定はしていません(外部者にはできませんね)。
また、パンダの更新はまず初めにオフラインで計算されます。
一般的なアルゴリズムのように“直で”メインのインデックスに反映されるわけではありません。
メインインデックスとは別のところで更新(の準備)が行われるのです。
公表された6月の2回のパンダ更新は複数の小さな更新・調整をまとめてメインのインデックスに反映したとも考えられます。
Google+で辻さんにご指摘いただきました。
ありがとうございます。