Pesquisadores usam Harry Potter para criar novas tecnologias de Inteligência Artificial

Últimas cotações

Bloomberg — Mais de duas décadas depois que J.K. Rowling apresentou ao mundo um universo de criaturas mágicas, florestas proibidas e um bruxo adolescente, Harry Potter está encontrando uma relevância renovada em uma área muito diferente de literatura: a pesquisa em inteligência artificial.

Um número crescente de pesquisadores está utilizando os livros best-sellers de Harry Potter para experimentar a tecnologia de inteligência artificial generativa, citando a influência duradoura da série na cultura popular e a ampla gama de dados linguísticos e jogos de palavras complexos em suas páginas. Revisar uma lista de estudos e artigos acadêmicos que referenciam Harry Potter oferece uma visão da pesquisa de ponta em IA - e algumas das questões mais espinhosas enfrentadas pela tecnologia.

No exemplo mais notável recentemente, Harry, Hermione e Ron são protagonistas de um artigo intitulado “Quem é Harry Potter?” que lança luz sobre uma nova técnica que ajuda grandes modelos de linguagem a esquecer seletivamente informações.

É uma tarefa de alto risco para a indústria: grandes modelos de linguagem, que alimentam chatbots de IA, são construídos com vastas quantidades de dados online, incluindo material protegido por direitos autorais e outros conteúdos problemáticos. Isso resultou em processos judiciais e escrutínio público para algumas empresas de IA.

Os autores do artigo, os pesquisadores da Microsoft Mark Russinovich e Ronen Eldan, afirmaram ter demonstrado que os modelos de IA podem ser alterados ou editados para remover qualquer conhecimento da existência dos livros de Harry Potter, incluindo personagens e tramas, sem sacrificar as habilidades analíticas e de tomada de decisão do sistema de IA como um todo.

A dupla disse que escolheu os livros devido à sua familiaridade universal. “Acreditávamos que seria mais fácil para as pessoas na comunidade de pesquisa avaliar o modelo resultante de nossa técnica e confirmar por si mesmas que o conteúdo foi de fato ‘desaprendido’”, disse Russinovich, diretor de tecnologia da Microsoft Azure. “Quase qualquer pessoa pode criar prompts para o modelo que sondariam se ele ‘sabe’ dos livros. Mesmo pessoas que não os leram estariam cientes de elementos da trama e personagens”.

Em outro estudo, pesquisadores da Universidade de Washington em Seattle, da Universidade da Califórnia em Berkeley e do Instituto Allen para IA desenvolveram um novo modelo de linguagem chamado Silo que pode remover dados para reduzir riscos legais. No entanto, o desempenho do modelo caiu significativamente se treinado apenas em texto de baixo risco, como livros fora de direitos autorais ou documentos governamentais, afirmaram em um artigo publicado no início deste ano.

Para ir mais fundo, os pesquisadores usaram os livros de Harry Potter para ver se pedaços individuais de texto influenciam o desempenho de um sistema de IA. Eles criaram dois repositórios de dados, ou coleções de sites e documentos. O primeiro incluía todos os livros publicados, exceto o primeiro livro de Harry Potter; o outro incluía todos os livros da série, exceto o segundo, e assim por diante. “Quando os livros de Harry Potter são removidos do repositório de dados, a perplexidade piora”, disseram os pesquisadores, referindo-se à medida de precisão dos modelos de IA.

Estudos de IA citaram Harry Potter há pelo menos uma década, mas isso se tornou mais comum à medida que acadêmicos e tecnólogos se concentraram em ferramentas de IA que podem processar e responder à linguagem natural com respostas relevantes. Com Harry Potter, “a abundância de cenas, diálogos, momentos emocionais o tornam muito relevante para a área específica de processamento de linguagem natural”, disse Leila Wehbe, pesquisadora da Carnegie Mellon que conduziu uma série de experimentos em 2014 coletando dados de ressonância magnética cerebral de pessoas lendo histórias de Harry Potter para entender melhor os mecanismos da linguagem.

No arXiv, um repositório de acesso aberto de pesquisa científica, artigos recentes incluem “Aprendizado de Máquina para o Desenvolvimento de Poções em Hogwarts”, “Grandes Modelos de Linguagem Encontram Harry Potter” e “Detectando Feitiços na Literatura Fantástica com uma Inteligência Artificial Baseada em Transformador”.

Mesmo quando não é central para a pesquisa, Harry Potter também é uma referência literária favorita para pesquisadores. Um estudo, por exemplo, usou as obras de Rowling para testar a inteligência de sistemas de IA, como aqueles que originaram o chatbot ChatGPT, um tópico que gerou muita polêmica nos debates recentes.

Terrence Sejnowski, que dirige o laboratório de neurobiologia computacional no Instituto de Estudos Biológicos Salk, argumentou no artigo que os chatbots refletem apenas a inteligência e os preconceitos de seus usuários, assim como o Espelho de Ojesed no primeiro livro de Harry Potter, que reflete os desejos de uma pessoa de volta para ela.

“Harry Potter é popular entre os pesquisadores mais jovens”, disse Wehbe. “Eles teriam lido os livros quando crianças ou adolescentes, pensando neles ao escolher um corpus de texto escrito ou falado.”

Veja mais em Bloomberg.com

Por que o Spotify precisa melhorar seus números financeiros em 2024