A Automattic, empresa dona do WordPress e do Tumblr está negociando com gigantes da inteligência artificial para fornecer dados de seus usuários para fins de aprendizado de máquina. Mas nem todo mundo está feliz com essa ideia.
Você já se perguntou o que acontece com o conteúdo que você publica na internet? Se você usa plataformas como WordPress ou Tumblr, pode ser que ele esteja sendo usado para treinar sistemas de inteligência artificial (IA) que geram conteúdo falso ou manipulado.
É isso que revelou uma reportagem da 404 Media na terça-feira, que afirmou que a Automattic, empresa controladora desses sites, está em conversas para vender conteúdo de suas plataformas para empresas de IA como MidJourney e OpenAI.
Essas empresas usam técnicas de IA generativa, que consistem em alimentar algoritmos com grandes quantidades de dados para que eles aprendam a imitar e produzir conteúdo semelhante. Essa tecnologia pode ser usada para fins criativos, educacionais ou de entretenimento, mas também pode ser usada para fins maliciosos, como espalhar desinformação, falsificar identidades ou violar direitos autorais.
A polêmica do conteúdo vendido pela Automattic
Segundo a 404 Media, o acordo entre a Automattic e as empresas de IA ainda não está fechado, mas já está causando polêmica dentro da própria empresa. Isso porque parte do conteúdo que seria vendido inclui conteúdo privado ou sensível dos usuários, que não deveria ser compartilhado com terceiros sem o seu consentimento.
Além disso, o conteúdo publicitário que nem sequer pertence à Automattic, como anúncios de uma antiga campanha da Apple Music, também teria sido copiado para o conjunto de dados de treinamento das empresas de IA, o que poderia gerar problemas legais.
A reportagem afirma que alguns funcionários da Automattic estão tão insatisfeitos com os planos da empresa que chegaram a apagar suas próprias fotos do Tumblr para evitar que elas fossem usadas para treinar IA.
Como você pode se proteger
Diante da repercussão negativa da reportagem, a Automattic publicou em seu blog, confirmando que está explorando formas de trabalhar com empresas de IA, mas tentando tranquilizar os usuários de que eles terão controle sobre o uso de seu conteúdo.
A empresa anunciou que vai introduzir uma nova configuração em suas plataformas que permitirá aos usuários optar por não ter seu conteúdo usado para treinar sistemas de IA. A configuração será semelhante à que já existe para impedir que os rastreadores da web indexem o conteúdo dos usuários.
A Automattic não esclareceu, porém, se a configuração será ativada ou desativada por padrão, nem quando ela estará disponível para todos os usuários. A empresa também não informou quais são as empresas de IA com as quais está negociando, nem quais são os termos do acordo.
A postagem da empresa também afirma que não há nenhuma lei que obrigue os rastreadores a respeitar as preferências dos usuários, e que a empresa está apenas seguindo as melhores práticas do setor. A Automattic ainda tentou vender a mudança como uma oportunidade de dar aos usuários mais controle sobre o conteúdo que eles criaram, e de participar dos avanços da IA, que está transformando rapidamente o mundo.