Bloomberg Opinion — A ação judicial movida pelo New York Times contra a OpenAI e a Microsoft (MSFT) por alegada violação de direitos autorais coloca uma das maiores instituições de mídia do mundo contra o fornecedor de uma nova tecnologia transformadora.
Simbolicamente, o caso promete um duelo de titãs: coleta de notícias por humanos, algo que exige muito trabalho, contra informações produzidas por inteligência artificial. Mas, legalmente, o caso representa algo diferente: um exemplo clássico da defasagem entre a lei estabelecida e a tecnologia emergente.
A lei de direitos autorais americana não foi projetada para abranger grandes modelos de linguagem (LLM) como o ChatGPT. Ela terá que ser conscientemente desenvolvida pelos tribunais – ou alterada pelo Congresso dos Estados Unidos – para se adequar às nossas circunstâncias atuais.
A principal questão jurídica do caso será a doutrina conhecida como “uso justo”, que informa quando é aceitável usar um texto protegido por direitos autorais de outra pessoa. O teste de uso justo tem quatro fatores.
Os usos educacionais e sem fins lucrativos têm maior probabilidade de serem considerados uso justo. O trabalho criativo recebe mais proteção de direitos autorais do que a redação técnica ou de notícias.
A quantidade de trabalho que foi copiado é importante, assim como a centralidade desse material para o trabalho copiado. E, talvez o mais importante para o processo do Times, os tribunais também consideram se a cópia prejudicará o mercado atual ou o futuro do trabalho que foi alvo.
Uma vez que você conhece a lei, pode estimar como serão os argumentos legais no caso. O Times apontará exemplos em que um usuário faz uma pergunta ao ChatGPT ou ao Bing e este responde com algo substancialmente parecido com um artigo do New York Times.
O jornal observará que o ChatGPT faz parte de um negócio e cobra taxas pelo acesso às suas versões mais recentes, e que o Bing é uma parte essencial do negócio da Microsoft. O Times enfatizará os aspectos criativos do jornalismo.
Acima de tudo, ele argumentará que, se você puder solicitar as notícias do dia a um mecanismo de busca movido a LLM e obtiver conteúdo extraído diretamente do New York Times, isso prejudicará substancialmente e talvez até mesmo destrua o modelo de negócios do Times.
A maioria desses pontos são argumentos jurídicos plausíveis.
Mas a OpenAI e a Microsoft estarão preparadas para eles. Elas provavelmente responderão dizendo que seu LLM não copia; em vez disso, ele aprende e faz previsões estatísticas para produzir novas respostas. Se eu ler um artigo no New York Times e depois escrever uma coluna de opinião na Bloomberg sobre o mesmo assunto, isso não é violação de direitos autorais, mesmo que eu tenha aprendido muito com o artigo do Times e tenha me baseado nessas informações para formar minha própria opinião.
Por esse motivo, muitos especialistas em direitos autorais têm teorizado que pode não ser uma violação de direitos autorais o fato de um LLM aprender com material online existente, mesmo que ele esteja protegido por direitos autorais.
Também é de se esperar que os réus argumentem que as notícias consistem em fatos e, portanto, devem ser tratadas com mais permissividade do que o material criativo.
Mas a Microsoft e a OpenAI terão dificuldade em refutar o último argumento – que seu produto, que depende de empresas de coleta de notícias como o Times, prejudicará essas empresas. O ChatGPT e outros LLMs não podem sair pelo mundo para coletar e examinar novos fatos. Eles estão restritos, em um futuro próximo, a “aprender” com informações que já foram publicadas.
Portanto, para que os LLMs forneçam informações úteis, outra pessoa – ou seja, um LLM humano – deve primeiro coletar as informações, verificar se elas são precisas e publicá-las. Essa é a essência da coleta de notícias. É caro fazer isso direito.
Além disso, para sabermos que podemos confiar nas notícias, precisamos que elas venham de uma instituição em que possamos confiar – uma instituição com um histórico e uma reputação que tenha interesse comercial em manter. Caso contrário, não teríamos notícias. Teríamos uma câmara de eco iterativa desvinculada da realidade.
É aqui que o interesse público fundamental na manutenção da imprensa livre torna-se relevante para a questão do uso justo.
Se você puder obter informações mais baratas de um LLM do que do New York Times, talvez pare de assinar o jornal. E se todos fizessem isso, não haveria New York Times. Em outras palavras, a OpenAI e a Microsoft precisam que o New York Times e outras organizações de notícias existam se quiserem veicular notícias confiáveis como parte de seus serviços. Portanto, de forma racional e econômica, elas devem ser obrigadas a pagar pelas informações que estão usando.
A adequação desse poderoso interesse público à lei de direitos autorais não será simples para os tribunais. A cópia literal é a forma de infração mais fácil de ser punida. Em circunstâncias legais comuns, se os LLMs mudarem as palavras o suficiente para resumir em vez de copiar, isso enfraquecerá o caso do Times.
No entanto resumos com palavras diferentes ainda seriam suficientes para matar o Times e organizações semelhantes – e nos deixar sem notícias.
Os tribunais precisarão estar atentos a tudo isso. Se eles não acertarem, o Congresso terá que agir. A infraestrutura de notícias já está cambaleando. Se a destruirmos completamente, quem perderá será a democracia.
Esta coluna não reflete necessariamente a opinião do conselho editorial ou da Bloomberg LP e de seus proprietários.
Noah Feldman é colunista da Bloomberg Opinion. É professor de direito na Universidade de Harvard e autor de “The Broken Constitution: Lincoln, Slavery and the Refounding of America”.
Veja mais em Bloomberg.com
Leia também
Pesquisadores usam Harry Potter para criar novas tecnologias de Inteligência Artificial