Bloomberg — A OpenAI está em conversas com as empresas de mídia CNN, Fox e Time para licenciar seu conteúdo, segundo pessoas familiarizadas com o assunto ouvidas pela Bloomberg News, em um esforço crescente da empresa para garantir acesso a material jornalístico para desenvolver seus produtos de inteligência artificial, ao mesmo tempo em que enfrenta alegações de violação de direitos autorais.
A startup por trás do ChatGPT, uma ferramenta que permite aos usuários gerar rapidamente texto, código e outros conteúdos com comandos simples, busca fazer acordos com diversos produtores de notícias, vídeo e outras mídias digitais que podem ser usados para tornar o chatbot de IA mais preciso, relevante e atualizado. A OpenAI também enfrenta processos na Justiça alegando infração de direitos autorais.
A OpenAI discute obter licença de artigos da CNN, emissora que pertencente ao grupo Warner Bros Discovery, que podem ser usados para treinar o ChatGPT e também apresentar o conteúdo da CNN nos produtos da OpenAI, de acordo com uma das fontes, que falou sob condição de anonimato para discutir assuntos privados.
A CNN e a Fox negociam não apenas obter a licença para texto, mas também para o conteúdo de vídeo e imagem, disseram as fontes. A CNN e a Fox se recusaram a comentar.
Jessica Sibley, CEO da Time, disse em um comunicado que a editora “está em discussões com a OpenAI e estamos otimistas sobre alcançar um acordo que reflita o valor justo de nosso conteúdo.” As conversas da OpenAI com os três empresas de mídia não foram divulgadas anteriormente.
A OpenAI informou à Bloomberg News na semana passada que está em conversas com dezenas de veículos sobre acordos de licenciamento, mas não citou empresas específicas.
Essas parcerias são cruciais para o futuro da OpenAI, pois ela equilibra a necessidade de obter dados atualizados e precisos para desenvolver seus modelos enquanto sofre pressão para deixar clara a origem desses dados.
Uma das empresas com as quais a startup de IA estava em conversas, o New York Times, processou a OpenAI e a Microsoft no mês passado por usar os artigos do jornal sem permissão.
Em resposta a um pedido de comentário sobre as conversas com as empresas, um porta-voz da OpenAI indicou a recente postagem no blog da empresa, que mencionava “colaboração contínua com empresas de notícias.”
“Nossos objetivos são apoiar um ecossistema de notícias saudável, ser um bom parceiro e criar oportunidades mutuamente benéficas”, disse a OpenAI na postagem do blog na segunda-feira, rebatendo o processo do Times.
A empresa afirmou que “busca parcerias com organizações de notícias” para treinar seus sistemas de IA em “conteúdo não disponível publicamente” e mostrar “conteúdo em tempo real com atribuição” no ChatGPT.
A OpenAI disse que está em discussões com a News/Media Alliance, um grupo que representa mais de 2.200 meios de comunicação em todo o mundo, “para explorar oportunidades, discutir suas preocupações e oferecer soluções”.
A startup de IA também conversa com a Gannett, News e IAC, de acordo com recentes reportagens do New York Times.
Algumas outras grandes empresas de mídia estão dispostas a entrar em negociações com a OpenAI. “Tivemos diálogo prévio com uma ampla gama de desenvolvedores, incluindo a OpenAI, que esperamos que agora possam se transformar em discussões comerciais sobre o uso de nosso jornalismo para construir e impulsionar seus produtos”, disse a Guardian News & Media, que publica o jornal The Guardian, em um comunicado.
A OpenAI recentemente fechou um acordo de licenciamento de vários anos com a Axel Springer, empresa-mãe do site Politico, por dezenas de milhões de dólares, como relatado anteriormente pela Bloomberg. Em julho, a OpenAI anunciou um acordo com a Associated Press por um valor não divulgado.
Não todas as grandes empresas de mídia estão correndo para fazer negociações com a OpenAI. O Washington Post não esteve em conversas com a OpenAI nos últimos meses, segundo um porta-voz do jornal. Uma outra empresa de mídia considera tomar medidas legais contra a OpenAI, semelhante ao New York Times, segundo um executivo da empresa que falou sob condição de anonimato.
Uma preocupação para as empresas é a compensação. O site The Information relatou anteriormente que a OpenAI ofereceu às empresas entre US$ 1 milhão e US$ 5 milhões por ano para licenciar seus artigos.
Esse intervalo é considerado baixo para certas empresas, segundo pessoas familiarizadas com o assunto. Algumas estão abertas discutir a uma faixa mais próxima do que a Axel Springer recebeu, disse uma das fontes.
A OpenAI está em discussões para levantar uma nova rodada de financiamento com uma avaliação em ou acima de US$ 100 bilhões, disseram pessoas com conhecimento do assunto à Bloomberg anteriormente. A startup arrecadou US$ 13 bilhões até o momento da Microsoft.
Um executivo de mídia, que pediu para não ser nomeado para discutir assuntos privados, estava cético de que um acordo produtivo pudesse ser alcançado com empresas de IA até que os tribunais esclareçam como a lei de direitos autorais se aplica à IA generativa. Alguns na indústria também estão pedindo ao Congresso dos EUA que intervenha.
Na quarta-feira, um subcomitê judiciário do Senado realizou uma audiência sobre a supervisão da IA no jornalismo. Durante a audiência, o CEO da Condé Nast, Roger Lynch, instou o Congresso a emitir regras dizendo que o conteúdo protegido por direitos autorais deve exigir uma licença para ser usado para IA generativa comercial. “As ferramentas de IA atuais foram construídas com bens roubados”, disse ele.
Várias pessoas familiarizadas com as negociações de mídia também enfatizaram a importância de como a OpenAI apresentará o conteúdo de veículos de comunicação e quanto tráfego será direcionado de volta aos sites de mídia para aumentar sua audiência. A OpenAI afirmou que um dos objetivos de suas negociações é exibir conteúdo em tempo real com atribuição.
Os riscos são altos para a OpenAI manter o acesso a obras protegidas por direitos autorais. Em uma apresentação neste mês para a Câmara dos Lordes (semelhante ao Senado) do Reino Unido, a OpenAI disse que “seria impossível treinar os modelos de IA líderes de hoje sem usar materiais protegidos por direitos autorais”, dado o quanto de conteúdo online é protegido por direitos autorais.
“Limitar os dados de treinamento a livros de domínio público e desenhos criados há mais de um século pode resultar em um experimento interessante”, disse a empresa, “mas não forneceria sistemas de IA que atendam às necessidades dos cidadãos de hoje.”
Veja mais em Bloomberg.com
Leia também
Google faz centenas de demissões em hardware, engenharia e assistência digital
Por que o bitcoin, apesar do novo ETF, não é a reserva de valor que os defensores alegam