Venda de rostos para treinar IA, mas torna-se vítima de deepfake, a sombria verdade da indústria cinza de IA global.

AI灰色產業

Uma investigação aprofundada do jornal britânico The Guardian revelou uma indústria cinzenta global em rápido crescimento: milhares de pessoas comuns da África do Sul, Índia e Estados Unidos estão trocando suas vozes, rostos, vídeos de marcha e gravações de chamadas privadas por dinheiro para treinar IA. À medida que a demanda das empresas de IA por dados humanos de alta qualidade ultrapassou o que está disponível na rede pública, plataformas de coleta pagas como Kled AI, Silencio e Neon Mobile surgiram.

Dois casos reais: quem está se vendendo e por quê

Essa corrida global por dados de IA é impulsionada de forma particularmente direta nos países em desenvolvimento.

Jacobus Louw, um jovem de 27 anos da Cidade do Cabo, África do Sul, completou a tarefa de “navegação urbana” na Kled AI, trocando um vídeo de caminhada por 14 dólares, cerca de 10 vezes o salário mínimo local. Ele admite que sabe o preço da privacidade, mas, devido a anos de doença no sistema nervoso, não consegue arranjar emprego e acumulou 500 dólares vendendo vídeos do dia a dia para se inscrever em um curso de formação de massagista. “Como sul-africano, receber dólares vale mais do que as pessoas imaginam,” disse Louw.

Sahil Tigga, um estudante de 22 anos de Ranchi, Índia, vende gravações de ruído ambiental através da Silencio, ganhando mais de 100 dólares por mês; Ramelio Hill, um aprendiz de soldador de 18 anos de Chicago, EUA, vende suas gravações de chamadas privadas para a Neon Mobile por 0,50 dólares por minuto, totalizando cerca de 200 dólares por cerca de 11 horas de gravações. Sua lógica é simples e direta: as empresas de tecnologia já possuem muitos dados pessoais sobre ele, então por que não também lucrar com isso.

Como a escassez de dados de IA deu origem a essa indústria cinzenta

As melhorias em IA generativa, como ChatGPT e Gemini, dependem de enormes quantidades de dados humanos de alta qualidade, mas conjuntos de dados abertos predominantes como C4, RefinedWeb e Dolma já começaram a restringir o uso comercial. Pesquisadores estimam que as empresas de IA esgotarão dados textuais novos e de alta qualidade até 2026. O treinamento com dados sintéticos gerados por IA já se mostrou propenso a produzir “lixo” cheio de erros e causar falhas, aumentando ainda mais a escassez de dados humanos reais.

As plataformas de coleta pagas que surgiram a partir disso formaram um novo ecossistema global de trabalho digital temporário:

Kled AI: compra de fotos e vídeos do dia a dia por tarefa

Silencio: coleta de áudio ambiental por meio de crowdsourcing, com pagamentos em criptomoedas

Neon Mobile: compra de gravações de diálogos e chamadas a 0,50 dólares por minuto

Luel AI (apoiado pela Y Combinator): coleta de diálogos multilíngues por cerca de 0,15 dólares por minuto

ElevenLabs: permite que os usuários façam clonagem digital de suas próprias vozes, com uma taxa básica de 0,02 dólares por minuto

Bouke Klein Teeselink, professor de economia do King’s College de Londres, aponta que o trabalho de treinamento de IA é uma nova categoria emergente que crescerá substancialmente, e que as empresas de IA pagam ativamente por coleta para evitar possíveis disputas de direitos autorais decorrentes da dependência total de raspagem da web.

Deepfake e licenciamento irrevogável: o custo real da indústria cinzenta

Os riscos legais dessas plataformas são quase desconhecidos pelos usuários. Enrico Bonadio, professor de direito da Universidade St. George de Londres, aponta que os acordos de licenciamento geralmente concedem às plataformas “direitos globais, exclusivos, irrevogáveis, transferíveis e isentos de royalties”, permitindo que vendam, exibam, armazenem e criem obras derivadas a partir delas, enquanto os fornecedores têm pouco ou nenhum caminho real para retirar seu consentimento ou renegociar.

A experiência do ator Adam Coy, de Nova York, é um dos casos mais representativos. Ele licenciou sua imagem para o software de edição de vídeo de IA Captions por 1.000 dólares, com um contrato que proibia explicitamente o uso para propaganda política ou conteúdo pornográfico, com um prazo de um ano. Mas logo depois, um amigo dele descobriu um vídeo com milhões de visualizações no Instagram, onde “ele” se autodenominava “médico vaginal”, promovendo suplementos médicos não verificados para mulheres grávidas. “A seção de comentários era estranha, porque estavam comentando sobre minha aparência, mas não era eu,” disse Coy. Desde então, ele não aceitou mais nenhum trabalho de dados de IA.

Mark Graham, professor da Universidade de Oxford, resume dizendo que esse trabalho é estruturalmente “instável, sem espaço para progressão, sendo na verdade uma rua sem saída”, e que o único vencedor a longo prazo é “as plataformas do hemisfério norte, que capturam todo o valor duradouro”.

Perguntas frequentes

O que é a indústria cinzenta de treinamento de IA e por que é chamada de “cinzenta”?

A indústria cinzenta de treinamento de IA refere-se a uma série de plataformas de coleta pagas que compram vozes, rostos, vídeos e gravações de chamadas de usuários comuns, pagando recompensas. É chamada de “cinzenta” porque as transações parecem legais, mas o uso final dos dados é opaco, os termos de licenciamento são extremamente assimétricos, e existe o risco de serem usados para deepfakes e outros abusos potenciais, flertando com as fronteiras entre conformidade e exploração.

Quais são os riscos legais específicos de vender dados pessoais para treinar IA?

Os fornecedores geralmente concedem à plataforma direitos de uso irrevogáveis sobre dados biométricos sem compreender plenamente os termos. Jennifer King, pesquisadora da Universidade de Stanford, aponta que os consumidores enfrentam o risco de seus dados serem reutilizados de maneiras “que eles não gostam, não entendem ou não previram, e que, na ocasião, quase não há remédio”. O incidente de violação de segurança da Neon Mobile já confirmou que, após vazamentos de dados, a plataforma pode nem informar os usuários afetados.

Qual é a relação entre essa indústria cinzenta e o ecossistema de criptomoedas?

Algumas plataformas de treinamento de IA (como a Silencio) pagam recompensas em criptomoedas, utilizando pagamentos descentralizados para reduzir a barreira de recebimento de pagamentos internacionais, permitindo que os usuários de países em desenvolvimento recebam diretamente em stablecoins ou tokens nativos. Isso transforma o mercado de dados de IA em um ramo importante das aplicações do mundo real de criptomoedas, trazendo múltiplas considerações sobre valorização de tokens, liquidez e ética de dados.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.
Comentário
0/400
Sem comentários