生成AIに作品を学習されたくない!個人サイト展示物をAI学習から保護する方法

2022年ごろから、生成AIの技術の発展が加速しています。文章だけでなく、画像の生成技術も年々向上していることは、ネットを利用している多くの方がご存知でしょう。

便利な技術の発達が喜ばれる一方で、生成に必要な学習元データの出どころがはっきりしないことや、自分の著作物が生成AIに勝手に利用されているかもしれないこと、文章や絵柄などを模倣されてしまう可能性があることに、疑問や不快感を示すクリエイターが多いことも事実です。

この記事では、個人サイトに展示されている作品を生成AIに学習させないようにするための対処法を紹介します

生成AIはどのように「学習素材」を集めるのか

そもそも、生成AIはどのようにして学習元となる素材を集めているのでしょうか?

その方法はAIの種類によってもさまざまですが、一部のAIはクローラーと呼ばれるロボットを使って、インターネット上に公開されているデータを自動収集し、学習しています。

クローラーと聞いてピンとくる方もいるかもしれません。そう、Googleなどの検索エンジンもクローラーを使って、インターネット上に公開されているサイトのデータを集めているのでしたね。

では、いわゆる検索避けを施しているサイトであれば、生成AIに学習されずに済むのでしょうか

答えは「意味はあるが、不十分かも」です。なぜなら、検索エンジンが使っているクローラーと、生成AIが使っているクローラーとは同じものではないからです。

生成AIのクローラーをブロックする方法

クローラーをブロックするには、robots.txtという名前のテキストファイルを作成し、以下のように記述します。

この方法はrobots.txtを利用するため、サーバーレンタルではなくホームページスペースなどを利用して個人サイトを運営している場合、導入できないことがあります。詳しくは、ご利用のサービスの仕様や規約をご確認ください。

User-agent: (ここにブロックしたいクローラーの名前を記述)
Disallow: /

そして、このテキストファイルを公開ディレクトリにアップロードします。つまり、クローラーをブロックしたいサイトの一番上層のディレクトリに置くのです。

サイトの入り口となる「index.html(もしくはindex.php)」がアップロードされている場所と同じ場所にアップロードすればよい、という理解でよいでしょう。

生成AIのクローラーの中でも規模の大きなものだと、画像生成AI「Stable Diffusion」などが利用しているCommon Crawl、ChatGPTで知られるOpenAIが利用しているGPTBot、そしてGoogle社の生成AIクローラーなどがあります。これらをブロックしたければ、robots.txt内に以下のように記述します。

User-agent: CCBot
Disallow: /

User-agent: GPTBot
Disallow: /

User-agent: ChatGPT-User
Disallow: /

User-Agent: Google-Extended
Disallow: /

クローラーのブロック以外のAI学習対策

検索避けを導入する

いわゆる検索避けは、生成AIのクローラーのブロックとしての機能は期待できませんが、AI学習対策という観点では意味があるといえます。

なぜなら検索避けを施すことで、Googleなどの検索エンジンの検索結果にあなたのサイトが載ることだけでなく、画像検索結果にあなたのイラストなどの画像が拾われることも防止できるからです

今は二次創作や著作権に詳しくない人が、Googleなどの画像検索を使って好みのイラストを悪気なく拾って利用するケースも少なくないようです。そこから無断転載に発展する可能性も、ゼロではありません。

自分の意図しないところに作品を利用される可能性を少しでも避けたいのであれば、検索避けの導入を強くオススメします。

イラストではなく文章を展示している方も、意図しない訪問者の流入を防ぐためにも、検索避けの導入をぜひご検討ください。

自分の持っているサーバー以外の場所に作品をアップロードしない

SNSを含む投稿サイトでは、ユーザーの投稿した文章や画像の取り扱いは、その利用規約や仕様によって左右される場合があります。また、SNS自体に検索避けがされていなければ、あなたがどれだけ対策したところで、検索エンジンにあなたの作品がインデックスされてしまうことは避けられないでしょう

また拡散性が高いSNSでは、ふとしたきっかけで信じられないくらい多くの人の目に自分の作品が晒される可能性があります。

そのため、SNSや投稿サイトなど、オープンで多くの人の目に触れる可能性が高く、自分の一存で掲載物の扱いを制御できなくなる危険のある場への作品掲載を控えることで、生成AIに学習される可能性を間接的に下げることはできると言えるでしょう。

   【PR】HTML/CSSを基礎から勉強したい方へ

HTML/CSS初心者のための書籍を執筆しました

個人サイトを作ろう! テンプレートですぐできる!すぐに身につく!HTML&CSS

これから初めてHTML・CSSに触れる方や、過去に個人サイトを作ったことがあるけど、最新のHTML・CSSやウェブサイト制作を学び直したい!という方に向けた、創作・同人サイトを作るための本です。
書籍購入者には特典として、「do」でも配布していないオリジナルHTMLテンプレート3種が利用できます。本書では、このテンプレートを実際に自分で編集することでHTML・CSSを学んでいくため、初めての方でも理解しやすい内容に仕上がっています。
「do」では紹介しきれなかった、サイト制作の基礎の基礎から網羅した入門にオススメの書籍です。ぜひお手に取ってみてください!

Amazonで購入する