A OpenAI, empresa que controla o ChatGPT, está sendo processada por suposta violação de direitos autorais. As requerentes são a Enciclopédia Britânica e o Dicionário Merriam-Webster.
Ambas as empresas acusam a OpenAI de ter utilizado conteúdo cujos direitos de reprodução lhes pertencem para treinar a LLM que alimenta o ChatGPT.
A Britannica, empresa por trás do Merriam-Webster, afirma que a inteligência artificial utiliza, reiteradamente, o conteúdo de mais de 100 mil artigos seus publicados na internet.
O teor das acusações
No processo contra a OpenAI, as requerentes apontam também uma “violação sistemática” e “massiva” de Copyright nas respostas do ChatGPT. Segundo as empresas do Reino Unido, as respostas dadas pelo chatbot contêm cópias completas ou parciais de trechos de materiais que lhes pertencem.
Citando a Lanham Act, legislação dos Estados Unidos que regula marcas registradas, a Britannica diz ainda que em determinadas alucinações o ChatGPT fornece respostas erradas e as atribui à sua enciclopédia.
O RAG (Retrieval Augmented Generation), que é o sistema utilizado pelas IAs para fazer consultas em tempo real e responder a dúvidas dos usuários, também é apontado instrumento de violação de direitos de autor.
Uma “pedra no sapato” dos publishers
Ainda nas alegações do processo, o dicionário e a enciclopédia britânica que acusam a OpenAI de violar tratados de direitos autorais cita o “elefante na sala” da internet na atualidade: o ChatGPT, assim como outras IAs, estão diluindo o protagonismo de criadores de conteúdo humanos.
Em determinada parte, as reclamantes citam que as receitas de publishers humanos estão sendo reduzidas pela ação das LLMs.
“O ChatGPT priva editores da web, como a Britannica, de receitas ao gerar respostas que substituem e competem diretamente com o conteúdo produzido por esses veículos”, diz o documento.
A OpenAI ainda não se pronunciou, pelo menos não de forma pública, sobre as acusações da Merriam-Webster.
Um debate que não é de hoje
Essa ação originada no Reino Unido é apenas mais uma de outras dezenas enfrentadas pela OpenAI mundo afora. Nos EUA, tradicionais veículos de mídia, autores e criadores de conteúdo, como The New York Times e Chicago Tribune, além do canadense Toronto Star, são alguns exemplos.
As alegações são sempre as mesmas: o ChatGPT estaria violando direitos autorais tanto no treinamento base quanto no fornecimento de respostas via RAG.
Além disso, o mercado de forma geral tem reagido à queda nas receitas de criadores de conteúdo online por causa de respostas automáticas geradas pela IA.
Sistemas de justiça ao redor do mundo ainda estão adequando seus quadros legais para processos envolvendo inteligências artificiais. No entanto, um entendimento parece emergir: o de que o uso de informações protegidas por Copyright para treinamento não viola direitos, mas o plágio dessas informações, sim.
Quanto ao “sequestro” de receitas provocado pelas IAs, resta esperar quais medidas as big techs, sobretudo o Google, vão tomar para evitar a derrocada final dos criadores de conteúdo humanos.












