Como proteger suas imagens de geradores de arte AI

Como proteger suas imagens de geradores de arte AI

Embora seja divertido imitar as obras de artistas antigos como Van Gogh ou Frida Kahlo com um gerador de IA, o mesmo não é verdade para artistas vivos. Permitir que qualquer pessoa crie uma imagem “no estilo” de um artista pode fazer com que seu mercado seja inundado com imitações; adicionando confusão em torno da autenticidade e uma possível perda de receita.

Em resposta, as pessoas estão procurando uma maneira de proteger suas imagens de geradores de arte AI. As respostas podem não ser perfeitas ou infalíveis, mas existem maneiras de proteger suas imagens de serem usadas por geradores de arte de IA.

Como os geradores de IA obtêm suas imagens

Os geradores de arte de IA passam por um período de “treinamento” para aprender a produzir uma imagem quando recebem um prompt de texto. Como parte do processo de aprendizado, ele precisa estudar centenas de milhões de pares imagem-texto para eventualmente gerar uma imagem precisa de objetos, cores e cenas do mundo real – juntamente com técnicas e estilos artísticos.

Acontece que os modelos de IA precisam aprender com a criatividade dos humanos. Por exemplo, Midjourney e Stability Diffusion são dois geradores de arte de IA treinados no conjunto de dados LAION-5B de código aberto, contendo bilhões de imagens de toda a Internet.

Usando rastreadores da web para “raspar” sites em busca de dados, esses conjuntos de dados criam listas de URLs de imagens, além de suas legendas, em algo que pode se assemelhar a uma enorme planilha do Excel. Se você postou sua arte online antes, ela pode estar em um conjunto de dados de imagem e, portanto, usada para treinar IA, tenha você consentido ou não.

1. Desative os conjuntos de dados de treinamento de IA

Spawning é um grupo de artistas cujo site popular, Have I Been Trained? , pode ser usado para ver se suas imagens estão no conjunto de dados LAION-5B. Assumindo a responsabilidade, eles posteriormente adicionaram a função para desativar o conjunto de dados. Sob um acordo, a Spawning passará as listas de exclusão de usuários para a LAION, que disse que honrará o pedido e removerá essas imagens de sua coleção.

A ferramenta de desativação da Spawning ainda requer algum desenvolvimento, pois, no momento em que escrevo, você não pode adicionar várias imagens de uma só vez. Também não há acordos de exclusão com qualquer outro conjunto de dados que possa ser usado para treinar modelos de IA.

Como muitas empresas de IA não divulgam os detalhes mais sutis sobre como seus modelos de IA são construídos, às vezes não fica claro qual conjunto de dados eles estão usando. O DALL-E é um popular gerador de arte de IA que não compartilha essas informações.

Captura de tela da preferência da bandeira noai no DeviantArt

Como alternativa, se você usar o DeviantArt para compartilhar sua arte, suas imagens agora estão protegidas por padrão contra uso em conjuntos de dados de treinamento de IA. Ele funciona marcando sua imagem com “noai”, o que significa que, se for descoberto que um modelo de IA usou sua imagem para treinamento, ele estará violando os Termos de Serviço do DeviantArt.

Obviamente, essas medidas de exclusão não são aplicadas, portanto, podem ser ignoradas por terceiros, se assim o desejarem. Embora esta não seja a solução mais eficiente, ela está abrindo caminho para mais regras e regulamentos para proteger o trabalho dos artistas.

Em um mundo ideal, as pessoas teriam a opção de participar, em vez de optar por não participar. Esperamos ver isso acontecer no futuro. Para obter mais detalhes sobre como remover suas imagens dos conjuntos de dados, consulte nosso guia sobre como excluir suas imagens do treinamento de IA.

Se a prática de extrair imagens da internet é legal, foi levado ao conhecimento dos tribunais. E ajudar os artistas a apresentar provas do seu lado é o direito autoral da imagem que eles possuem.

Resultados para a artista Sarah Andersen usando o site Have I Beeen Trained

No início de 2023, a conhecida quadrinista Sarah Andersen , fazia parte de um grupo de artistas que moveu uma ação contra as empresas de IA Stability AI e Midjourney, bem como o site de compartilhamento de arte DeviantArt, por raspar a obra de sua arte sem consentimento – incluindo a arte de incontáveis ​​milhões de outros artistas.

Outro exemplo é o site de imagens Getty Images, que entrou com uma ação contra a Stability AI por copiar suas imagens sem licença. A maneira como descobriu que suas imagens com direitos autorais estavam sendo usadas foi quando as imagens geradas por IA começaram a aparecer com a marca d’água da Getty Images – uma revelação bastante óbvia.

Embora a legalidade seja determinada oportunamente, os direitos autorais são uma das poucas coisas que podem ser usadas para lutar pelos direitos do trabalho dos artistas, como visto nos casos que mencionamos. Pode não estar atualizado com a tecnologia AI, mas pode aumentar sua defesa no futuro.

É uma prática que vale a pena aprender de qualquer maneira, para que você possa proteger seu trabalho de ser roubado, esteja a IA envolvida ou não. Siga nosso guia sobre como proteger suas fotos para obter uma visão detalhada de como tudo funciona.

3. Bloquear rastreadores de sites com Robots.txt

Os conjuntos de dados de imagens só conseguem indexar um grande número de imagens porque usam algo chamado rastreadores da web. Como o nome pode sugerir, eles rastejam por sites em busca de informações específicas.

Alguns rastreadores são úteis e ajudam os mecanismos de pesquisa, como o Google, a encontrar e indexar as informações mais relevantes para exibição em sua página de resultados de pesquisa. Outros são usados ​​para coletar imagens de sites para incluir em conjuntos de dados de treinamento de IA.

Foto de um laptop exibindo o código do computador

É aí que entra o Robots.txt. Robots.txt é um arquivo de texto que pode ser colocado no código de back-end de um site para informar aos rastreadores da Web o que eles podem ou não verificar. Você pode usá-lo para impedir que um rastreador examine determinadas páginas ou arquivos, o que é útil se você não deseja que suas imagens sejam usadas pela IA.

Se você quiser saber mais, leia nosso guia sobre o que é um rastreador da web e como ele funciona. Para quem tem um site, peça ao seu desenvolvedor da Web para incorporar um Robots.txt no código do site para impedir que suas imagens sejam descartadas por conjuntos de dados de treinamento de IA.

O que esperar no futuro

É frustrante ter que competir com modelos de IA, mas mais soluções estão a caminho.

Por um lado, os processos judiciais estão em processo de definição do que é legal e como os direitos autorais funcionam com a geração de imagens de IA. O resultado desses debates públicos estabelecerá padrões legais e, possivelmente, regulamentações imediatas que as empresas de IA devem seguir.

Por outro lado, os desenvolvedores estão pensando em como resolver o problema usando novas tecnologias. Em um estudo promissor, a pesquisa mostra que você pode usar IA para combater a si mesma, tornando uma imagem “inapreensível” para conjuntos de dados de treinamento de IA.

Como explica a Dra. Sarah Monazam Erfani, da Universidade de Melbourne : “Desenvolvemos uma técnica baseada em aprendizado de máquina que identifica e altera apenas os pixels suficientes em uma imagem para confundir a IA e transformá-la em uma imagem ‘inapreensível’. A mudança é muito pequena e imperceptível aos olhos humanos, mas introduz ‘ruído’ suficiente em uma imagem para torná-la inútil para o treinamento de IA.”

Se você é alguém afetado por geradores de imagens de IA, vale a pena fazer sua voz ser ouvida para que essas empresas sejam pressionadas a mudar suas práticas. Foi apenas por causa do forte feedback da comunidade DeviantArt que uma nova preferência de exclusão foi criada, então certifique-se de dar feedback às plataformas de compartilhamento de arte e empresas de IA.

Defendendo suas imagens da IA

Você pode proteger suas imagens de geradores de arte de IA desativando conjuntos de dados de treinamento de IA, protegendo suas imagens com direitos autorais e usando o padrão Robots.txt. Embora isso não garanta que suas imagens fiquem fora dos sistemas de IA, usar todos os três métodos lhe dará a melhor defesa até que mais soluções sejam desenvolvidas.

Novas ferramentas estão a caminho, incluindo maneiras de ajustar imperceptivelmente sua imagem para que a IA não aprenda com ela, tornando-a inútil para treinar geradores de arte de IA. Enquanto isso, não desista. Ainda existem maneiras de proteger suas imagens de geradores de arte AI.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *