Bingチャットがリンク表示や学習データにサイトのコンテンツを使うのを拒否する方法

[レベル: 上級]

サイトのコンテンツが Bing Chat の回答にどのように利用されるかをコントロールする方法が提供されました。

Bing チャットの回答には、関連するページへのリンクが含まれます。
また、回答には、ウェブのコンテンツから学習した内容も含まれます。

シャインマスカットが安いのははぜ

このように、自分のサイトのコンテンツが、回答のリンクとして提供されたり学習データとして利用されたりするのを制御する方法です。

nocache タグと noarchive タグで Bing チャットを制御

nocache robots meta タグと noarchive robots meta タグでチャットを制御する仕組みを Bing は実装しました。
次の組み合わせです。

  • nocachenoarchive もなし:通常のウェブページの状態です。コンテンツの URL はリンクとして提供される場合があるし、学習データとして利用されます。特に制御する必要がないときはこれでかまいません。
  • nocache タグをページに追加:Bing チャットの回答にコンテンツが含まれる可能性があります。回答には、URL/スニペット/タイトルだけが表示されます。URL/タイトル/スニペットが Microsoft の生成 AI 基盤モデルのトレーニングに使用される場合があります。
  • noarchive タグをページに追加:コンテンツは、Bing チャットの回答に含まれず、回答内でリンクもされません。トレーニングに使用されることもありません。AI 利用を完全に拒否したい場合の手段です。
  • nocachenoarchive の両方をページに追加nocache のみとして処理されます。

Bing チャットを含む、Microsoft の生成 AI での利用や学習に自分のサイトのコンテンツを使われたくない問い場合は、nocache タグと noarchive タグで制御してください。
📝すずきメモ:Bing 検索ではnocachenoarchive に違いはなく同じ働き。Google 検索は nocacheをサポートしていないと思われる

ChatGPT の制御

ChatGPT の回答にリンクを含ませたくなかったり、学習データとして使わせたくなかったりする場合は、robots.txt で制御できます。

robots.txt による ChatGPT 本体の制御はこちらの記事を、プラグインの制御はこちらの記事で解説しました。

Bard と SGE の制御

Google の Bard および SGE のコンテンツ利用を制御する手段は今のところ提供されていません。
どのような手段を提供するかを今後検討する必要があるだろうと、Google の人から聞いています。

【UPDATE (2023/09/29)】
Bard による利用は robots.txt でブロックできるようになりました。
詳細はこちらの記事で説明してます。