Google ストップ語がなくなった

グーグルの「stop words in search」の現在の検索結果

Google検索の「ストップ語」というのを知ってますか?

ストップ語(Stop words)というのは、”a,the,and”のように一般的に使われる単語や語句で、検索対象のキーワードとしては除外されます。

ストップ語

ほとんどのウェブページで非常に頻繁に使用されている一般的な単語や文字です。ストップ語は検索結果の表示に時間がかかり、結果の品質にも貢献しないため、検索エンジンでは無視されます。

Google で特定の数字、および “how” や “the” のような言葉を検索できないのはどうしてですか。

“http” や “.com” のほか、数字または文字 1 文字など、頻繁に使われる言葉や文字は検索の際に無視されます。この理由として、これらの単語は検索結果の絞り込みにほとんど効果がなく、逆に検索速度の低下につながる可能性があるためです。Google ではこのような語句を “ストップ語” と呼んでいます。

ストップ語が他の文字句と一緒に検索入力された場合、ストップ語は無視されます。たとえば、「The Sound and the Fury」という検索では、”Sound” と “Fury” だけが検索されて結果が表示されます。ただし、「The Who」のようにストップ語だけが入力された場合は、その語句が検索されます。

しかし、Googleの検索でこのストップ語の扱いに変化がありました。

ストップ語を無視せずに、ストップ語を含めたまま検索結果を返すようになっているようです。

グーグルの「stop words in search」の以前の検索結果

上のキャプチャ画像は、以前の「stop words in search」というキーワードの検索結果です。
「in」がストップ語に相当するので、検索対象の単語として除外されています。

“in” is a very common words and was not included in your search.

この記事のトップのキャプチャ画像は、現在の「stop words in search」というキーワードの検索結果です。
ストップ語除外のコメントは表示されていません。

同様に、a,the,and,ofなどこれまで無視されていたストップ語は、今では無視されずに検索語の一部として扱われます。

Googleが、ユーザーに対してより正確な検索結果を返すように努めている証拠でしょうか。

僕たち日本人が、英語のストップ語を使って検索することは、そう多くはないと思います。
また、僕には日本語のストップ語にどのようなものがあるのか分かりません。
(格助詞の「が・は」や、助詞の「です・ます」など?)

ですが、日本語環境での検索結果にも影響を与えているかもしれません。