Microsoft(マイクロソフト)がつい最近取得した“Identifying a web page as belonging to a blog”というPatent(特許)によると、Microsoftは検索結果からのブログの排除を試みているようです。
Search engines are increasingly implementing features that restrict the results for queries to be from blog pages.
ブログの急速な普及とその価値を認めつつも、サーチエンジンは検索結果にブログが出現するのに、よりいっそう制限をかけ始めていると言及しています。
しかし、そうは言ってもブログと一般のサイトを区別するのは簡単なことではありません。
人間にとっては一目瞭然でも、アルゴリズムとして組み込んでコンピュータに認識するのは、そう簡単なことではないでしょう。
どのようにして、ブログだと判断するかも説明されています。
- サイトがホストされている場所
たとえばMSN Space、Yahoo 360、LiveJournalなど。
※アメリカでは代表的な無料でブログが持てるサービスです。 - ブログに代表的な単語や語句
たとえば、permalink、comment、trackback、powered byなど。
※英語以外の言語も含まれているそうです。 - 外部リンク先
たとえば、wordpress.orgやblogger.comなど。
※無料ブログサービスは、通常運営元へのリンクが貼られていますね。 - ブログを表すようなURL
たとえば、http://www.suzukikenichi.com/blog/。
※ブログをサイトのコンテンツの一部として位置づける場合などに多いです。 - ATOMフィードやRSSフィードの提供
※もともとはブログ固有の機能です。
このほかにも、ブログを識別する仕組みが説明されています。
Yahoo! Japanは、すでにブログフィルタなるものを導入していますが、これは主だった無料ブログのドメイン名をブログの判断基準にしているようなので、MicrosoftはYahoo!よりも厳しくブログを除外しそうな気配です。
ブログを排除する意味が、僕にはよく分かりません。
一般サイトであろうがブログであろうが、求めている情報を与えてくれるならどちらでも関係のないことです。
ブログを排除する仕組みを作るよりも、より検索精度の高いアルゴリズムを開発するべきではないでしょうか?