Vídeos criados por inteligência artificial podem limitar a criatividade humana?

A IA está avançando rapidamente na geração de vídeos a partir de textos e isso pode afetar o que vemos nos feeds de redes sociais no futuro

Por

Bloomberg Opinion — As habilidades criativas da IA (Inteligência Artificial) estão aprimorando suas habilidades de condução: enquanto a tecnologia de carros autônomos fica estagnada, houve uma notável explosão na pesquisa em torno de modelos generativos, ou sistemas de inteligência artificial que podem criar imagens a partir de textos simples.

Apenas na última semana, pesquisadores de IA da Meta (META) e do Google, da Alphabet (GOOGL), deram um extraordinário salto ao desenvolver sistemas que podem gerar vídeos a partir de praticamente qualquer texto que se possa imaginar.

Os vídeos da Meta, holding do Facebook, parecem saídos de cenários oníricos, mostrando um urso de pelúcia pintando flores ou um cavalo com pernas distendidas galopando sobre um campo. Eles duram cerca de um ou dois segundos e possuem uma qualidade que nem parece originária de suas respectivas fontes, mas ainda assim são impressionantes. Os vídeos gerados pelo Google parecem mais realistas, ilustrando café sendo derramado em uma xícara ou um voo sobre uma montanha nevada.

O Google também construiu um segundo sistema ainda mais impressionante chamado Phenaki, que pode criar vídeos mais longos, com duração de dois minutos ou mais. Aqui está um exemplo de um roteiro usado pelo Google para um dos vídeos:

“Muito trânsito em uma cidade futurista. Uma nave espacial alienígena chega à cidade futurista. A câmera entra na nave espacial alienígena. A câmera avança até mostrar um astronauta. O astronauta está digitando em um teclado. A câmera se afasta do astronauta. O astronauta deixa o teclado e caminha para a esquerda...”

Isso é menos de um terço de todo o roteiro, que lembra o de um filme com comandos como “câmera se aproxima”. Veja abaixo o vídeo resultante, publicado no Twitter por Dumitru Erhan, um dos criadores de Phenaki no Google Brain:

Uma característica mais notável de Phenaki é a sua capacidade de gerar vídeos longos com *roteiros que mudam ao longo do tempo*. Estes podem ser pensados como histórias, nas quais o usuário narra e cria cenas que mudam de forma dinâmica. Aqui está um vídeo de 2 minutos.

Você pode achar que é o fim de Hollywood ou que qualquer um com um computador poderá produzir grandes filmes. É mais ou menos isso que os pesquisadores visam. Erhan publicou que sua equipe queria empoderar as pessoas a “criar suas próprias histórias visuais... facilitar a criatividade para as pessoas”.

Provavelmente não veremos filmes gerados por IA no cinema em um futuro próximo. Mas quase certamente os veremos em nossos feeds nas redes sociais, principalmente no TikTok, no Reels do Instagram ou no YouTube.

O TikTok não respondeu a uma pergunta sobre a construção de sua própria ferramenta de geração de vídeos por IA, mas não seria estranho se a plataforma o fizesse. Os usuários do TikTok adoram colocar figurinhas, textos e telas verdes a seus vídeos, e a plataforma acomoda a demanda com novas tecnologias.

Em agosto, o TikTok adicionou um gerador de imagens IA a seu aplicativo para criar telas verdes estilizadas. Digite um roteiro como “Boris Johnson” e o TikTok irá trazer uma imagem abstrata que lembra vagamente o ex-primeiro-ministro britânico.

O que acontece quando as máquinas não só recomendam os vídeos que nos mantêm grudados na tela mas também têm maior influência na criação deles?

Muitos de nós adoramos assistir a vídeos de gatinhos e pessoas tropeçando, de modo que um algoritmo que possa produzir montagens falsas de tropeços ou gatinhos atrairia virais com pouco esforço – desde que os vídeos pareçam reais.

Os criadores de conteúdo no TikTok, e as próprias plataformas, têm todo incentivo para explorar uma ferramenta que pode gerar vídeos em escala, principalmente quando é barato e fácil. Para o resto de nós, o resultado seriam feeds ainda mais movidos por máquinas.

Alimentados por IA e algoritmos de recomendação, os vídeos acrescentariam ao feedback autorreforçado certos loops que alimentam nossas necessidades cognitivas.

A outra consequência é uma enxurrada de desinformação, mas pode haver menos necessidade de alertas sobre isso no curto prazo. As plataformas de mídia social têm intensificado seus esforços para eliminar o conteúdo falso, e tanto o Google quanto o Facebook se recusam a divulgar suas ferramentas de vídeo ao público devido ao potencial de mau uso (e presumivelmente relações públicas em crise).

O Google disse que seu próprio sistema gerou vídeos que foram tendenciosos contra as mulheres mesmo quando tentaram filtrar resultados estereotipados. O modelo ou seu código fonte não será divulgado até que o problema seja resolvido, disseram pesquisadores do Google.

É claro que em breve poderemos usar essas ferramentas com algumas restrições graças a organizações como a Stability AI.

A startup britânica lançou uma ferramenta de geração de imagens em agosto que permitiu que qualquer pessoa gerasse uma arte interessante, bem como fotos falsas de celebridades, políticos e zonas de guerra, algo que as maiores empresas de IA proibiram. Mas a Stability está trabalhando em uma ferramenta de geração de vídeo que planeja lançar publicamente quando estiver pronta.

Embora um maior acesso a essas ferramentas leve a mais conteúdo falso, isso também significa que mais pessoas estão cientes de que esses instrumentos existem. E provavelmente suspeitarão de fotos que pareçam falsas. Pelo menos é o que esperamos.

O que essas ferramentas farão com o consumo diário de conteúdo pelas pessoas é igualmente preocupante. Os pesquisadores do Google afirmam que suas ferramentas irão aumentar a criatividade humana. Mas quando ficar tão fácil fazer vídeos que não precisaremos pensar sobre isso, será que isso não estaremos limitando nossa imaginação? Talvez não em todos os casos.

Juntamente com os mecanismos de recomendação que impulsionam tanto do que vimos na internet, com a intenção de gerar cliques, isso faz com que nosso futuro pareça muito mais voltado para as máquinas e, sem dúvida, não muito criativo.

Esta coluna não reflete necessariamente a opinião do conselho editorial ou da Bloomberg LP e de seus proprietários.

Parmy Olson é colunista da Bloomberg Opinion e escreve sobre tecnologia. Já escreveu para o Wall Street Journal e a Forbes e é autora de “We Are Anonymous”.

Veja mais em Bloomberg.com

Leia também

Um terço da economia global entrará em recessão até 2023, prevê o FMI