[レベル: 上級]
トップニュースの構成を Google は改良しました。
この改良には、検索にも使われている BERT モデルの技術を利用しています。
トップニュースをトピックごとに分類して掲載
トップニュース(英語では “TOP STORIES”)は、最新のニュースをカルーセル形式で掲載するウェブ検索の機能です。
たとえば、”nasa news” で検索すると NASA(アメリカ航空宇宙局)に関するニュース記事が TOP STORIES 枠に掲載されます。
NASA のニュースが特に分類されることなく雑多にカルーセルに並んでいます。
改良された新しいトップニュースでは、トピックごとに分類して記事をまとめて掲載します。
月着陸プロジェクトの入札企業に新たに 5 社を NASA が追加したニュースだけが 1 つ目のカルーセルにまとまっています。
2 番目のカルーセルには、木星の衛星であるエウロパで水蒸気を NASA が検出したニュースだけがまとまっています。
最後は “Also in the news” という見出しで、NASA に関するそのほかのニュース記事がまとまっています。
BERT で分類
記事を分類するには、その記事が何について書いているのかをまず認識しなければなりません。
そして、さらに適切な見出しも必要です。
こうした処理には機械学習が使われています。
複数の機械学習の技術が用いられており、そのなかには BERT も含まれています。
Webmaster Conference Tokyo で Google の ゲイリーは次のように言っていました。
BERT はクエリ解釈やコンテンツ理解に使われるだけでなく、言語に関わるすべてに利用可能だ。
ニュース記事の分類にも言語の理解が当然必要です。
BERT を利用できる場面です。
重要な情報をスニペットで掲載
その記事について注目すべきコメントや関連する評論な重要な情報がある場合は、記事タイトルの下にスニペットとして掲載するようになります。
重要部分の抽出にも BERT は関わっていると思われます。
米 Google から導入開始
BERT によるトピック分類のニュース記事カルーセルは、まずは米 Google (google.com) の英語のモバイル検索で導入が始まります。
今後数か月の後、ほかの言語と地域にも導入する予定です。