[レベル: 上級]
Microsoft Bing が使用する LLM(大規模言語モデル)では、コンテンツの理解に構造化データが役にたつという情報を先週書いた記事で紹介しました。
ところが、LLM 最適化を目的とした構造化データの過度な利用に対して専門家が警鐘を鳴らしています。
Schema.org 創設者からの指摘
Dan Brickley(ダン・ブリックリー)氏は、データ標準エンジニアリングを専門にした人物です。
2012 年から 2024 年まで Google に在籍していて、Schema.org の創設メンバーの 1 人でもあります(Schema.org プロジェクトには今も関与)。
Microsoft Bing が LLM のトレーニングに構造化データを利用しているとことを報じた Search Engine Lanedの記事を引き合いに構造化データをさらに積極的に使うべきだという主張に対して、ブルックリー氏は次のようにコメントしています。
はしゃぎすぎないことが大切だ。LLM がウェブエコシステムにもたらす変化については、現実的に捉える必要がある。構造化データには今なお価値があり(それを生成・消費する新しい方法も含めて)、ブラウザ、OS、メールクライアントなど、あらゆるものにより賢い AI モデルが組み込まれていく今こそ、最小限の労力で最大の価値を生む場面にマークアップを集中させるべき時だ。
スキーママークアップ(構造化データ)をまるで魔法の粉のようにあちこちに振りかけるのはやめたほうがいい。ドキュメント化された利用パターンに沿って適用すべきだ。検索エンジンは、ウェブコンテンツを理解するために利用できるあらゆる手段を活用しようとするが、LLM があらゆる話題について自然言語を「ある程度」読めるようになったという事実は、「一生に一度レベル」のブレイクスルーであり、その影響はいまだ広がり続けている。
ちなみに、Google はこれまで、構造化データを最大限に活用するための機能について、比較的しっかりとドキュメント化してきた。
この変化の中で、より大きな問いかけも存在する。それは、いわゆる「ディープサーチ」や「エージェンティック」なツールがユーザーの代わりにサイトやインデックスを検索するようになったとき、ウェブ広告のエコシステムはどうなるのか?ということだ。こうしたツールがブラウザに組み込まれるようになれば、「広告を非表示にする」機能が当たり前になるのではないだろうか?
構造化データの使用には現実的かつ戦略的なアプローチが必要
ブリックリー氏の指摘の要点は、LLM が普及してきた時代において Schema.org マークアップを使用する際には、現実的かつ戦略的なアプローチが必要であるということです。
彼が主張する点は次のように解釈できるでしょう。
- LLM は変革をもたらす: 自然言語を理解する能力は重大なブレークスルーであり、ウェブコンテンツの解釈方法を変化させている
- 構造化データ(スキーマ)には依然として価値がある: 時代遅れではない
- スキーマを過剰に使用しない: やみくもに適用することは避けるべき
- 価値が高く、労力の少ない用途に焦点を当てる: ドキュメント化された利用方法(例:Google のような検索エンジンが特定の機能での使用を明示している場合)に基づき、明確なメリットが得られる場面でスキーマを実装すべき
- より大きな問題を認識する: 高度な AI 検索ツール(「ディープサーチ」、「エージェント的」ツール)がウェブ広告エコシステムを混乱させ、広告ブロックを容易にする可能性があるという、関連する重要な問題が起こりうる
要するに、LLM の能力向上を踏まえたうえで、明確にドキュメント化されたユースケースを優先し、スキーマ実装において現実的、戦略的、かつ効率的であることをサイト管理者に対しブリックリー氏は推奨しています。
(Bing の)LLM が構造化データを利用しているからといって、むやみやたらにマークアップしまくるのは賢い選択ではありません。
労力に見合った利益を得られる見込みは薄そうです。