Nova versão do ChatGPT pode mudar a interação entre humanos e IA. E isso assusta

A OpenAI lançou uma atualização que incluiu o modo de voz avançado, com a capacidade de falar 50 idiomas com franqueza semelhante à humana e de convencer as pessoas

Por

Bloomberg Opinion — Quase dois anos após o lançamento do ChatGPT da OpenAI, tive minha primeira verdadeira surpresa com o frenesi da Inteligência Artificial (IA).

É verdade que fiquei impressionada com a forma como os chatbots podem gerar respostas úteis e sintetizar informações. Eu me diverti com algumas das imagens que criei com vários aplicativos. Mas, na maior parte do tempo, abordei a IA com uma dose de ceticismo, e por vezes vi mais propaganda do que substância e ainda achei que era uma interação com um computador, e não com um ser humano.

Muito disso mudou quando passei a semana passada brincando com a atualização do modo de voz avançado do ChatGPT. O recurso começou a ser implementado para assinantes pagos na semana passada, após atrasos iniciais devido a possíveis problemas de segurança. Nesta semana, a OpenAI disse que lançaria seu assistente de voz para empresas e desenvolvedores usarem em seus próprios aplicativos.

Essa ferramenta extraordinária, capaz de falar 50 idiomas com uma franqueza semelhante à humana, tem o potencial de mudar para sempre a forma como as pessoas em todo o mundo interagem com a IA. Ela também inaugura uma nova era de incerteza no mercado de trabalho global.

A façanha mais impressionante em minha opinião foi a capacidade de dominar nuances culturais e idiomas diferentes do inglês. Vários aplicativos de tradução já existem há algum tempo, mas muitos ainda têm dificuldade em transformar o inglês em idiomas asiáticos em comparação com os europeus.

Houve melhorias ao longo dos anos, principalmente nos tradutores de texto para texto. Mas o modo de voz avançado do ChatGPT foi capaz de alternar perfeitamente entre os idiomas com respostas ao vivo que parecem humanas e com erros mínimos.

Leia mais: A IA foi concebida para ajudar a humanidade – até que as big techs a dominaram

Conversei com ele em japonês e o usei para praticar meu keigo, a forma honorífica mais complicada usada em ambientes formais e de negócios. Ele até passou no meu teste preferido para tradutores automáticos de japonês, reconhecendo que um semáforo de trânsito indica que a passagem está liberada pela cor azul, e não verde.

Quando pedi ao ChatGPT para me ajudar a aprender mandarim, ele ofereceu um feedback detalhado sobre meus tons vocais. Um analista da China observou que usá-lo para praticar o chinês falado foi “nada menos que alucinante”.

Outro momento de surpresa foi quando pedi que ele falasse comigo em Pidgin havaiano, uma língua que surgiu nas plantações de cana-de-açúcar das ilhas na década de 1830. Eu não a ouvia ser falada desde que meus avós faleceram, há cerca de dez anos.

A capacidade do ChatGPT de se transformar perfeitamente em um camaleão cultural foi surpreendente, e foi a primeira vez que senti que não estava apenas falando com uma máquina. Até me peguei respondendo como se fosse uma pessoa quando disse à ferramenta “desculpe interromper” e “muito obrigado”.

Não sou só eu.

O domínio do modo de voz avançado dos dialetos falados é desconcertante.

Um fundador jamaicano de uma startup compartilhou um clipe de si mesmo conversando com o ChatGPT no idioma local patois. Vídeos inundaram o TikTok com o aplicativo falando todos os idiomas, desde Singlish até o inglês vernacular afro-americano.

A capacidade do ChatGPT de se comunicar em dialetos abre as portas para que mais pessoas interajam com a ferramenta e a antropomorfizem. Pode parecer um truque, mas qualquer pessoa que mora em outro país sabe que o idioma e a cultura ultrapassam barreiras.

Ouvir alguém que fala como você, em qualquer idioma, cria instantaneamente um senso de afinidade. Durante a maior parte da era da internet, esse tipo de nuance cultural era algo que os computadores ainda não conseguiam captar, marcando um dos maiores diferenciais entre amigo e máquina.

Mas há possíveis consequências no uso de dialetos com a IA.

Um estudo da Nature publicado em agosto constatou que grandes modelos de linguagem geram “decisões secretamente racistas” sobre as pessoas com base em seus dialetos em um experimento baseado em texto.

Os pesquisadores descobriram que a IA tem maior probabilidade de sugerir que os usuários do inglês afro-americano “sejam designados para empregos de menor prestígio, sejam condenados por crimes e sentenciados à morte” em comparação com os falantes do inglês americano padrão.

Leia mais: Fim do emprego com IA? Para Daron Acemoglu, 5% estão realmente sob ameaça

Separadamente, a OpenAI reconheceu como os recursos de áudio, especificamente, de seu modelo mais recente podem acarretar riscos que ainda não compreendemos totalmente, como o fato de as pessoas criarem fortes vínculos ou permitirem “confiança cada vez mais desequilibrada” nos modelos de IA.

A empresa notou que os usuários que utilizam os recursos de áudio usam uma linguagem que pode indicar que eles sentem conexões com o modelo, dizendo que mais estudos internos e independentes precisam ser feitos para “definir de forma mais concreta essa área de risco”.

E o motivo pelo qual o chatbot agora parece tão humano é, em parte, o fato de suas nove vozes serem alimentadas por atores reais.

A OpenAI tem uma série de barreiras de proteção.

O ChatGPT respondeu a algumas perguntas que fiz mudando o assunto e dizendo que suas diretrizes não permitem que ele responda. Ele não pode cantar, se fazer passar por pessoas ou ser excessivamente paquerador.

A versão atual também não permite a tradução ao vivo de algo que não seja minha própria voz, como um discurso ou um vídeo, possivelmente para evitar um exame mais minucioso dos direitos autorais.

Observadores mais atentos criticaram sua proficiência em determinados idiomas e dialetos. Devido a obstáculos regulatórios, o modo de voz avançado ainda não está disponível na União Europeia e em alguns outros mercados.

Leia mais: Nova solução da OpenAI imita a voz de pessoas e amplia preocupação com deepfake

A nova capacidade do ChatGPT de romper as barreiras linguísticas, tanto para as empresas quanto para as pessoas, tem um enorme potencial positivo.

Mas, por mais hipnotizado que eu estivesse na semana passada, de vez em quando recebia uma resposta que me lembrava que era apenas um aplicativo – eu não deveria atribuir a ele muita responsabilidade nem vê-lo como um companheiro humano. Não pude deixar de me preocupar com um futuro em que as pessoas possam se esquecer disso.

Esta coluna não reflete necessariamente a opinião do conselho editorial ou da Bloomberg LP e de seus proprietários.

Catherine Thorbecke é colunista da Bloomberg Opinion e cobre tecnologia na Ásia. Já foi repórter de tecnologia na CNN e na ABC News.

Veja mais em Bloomberg.com

Leia também

Petrobras quer expandir 1º campo do pré-sal, que fez do Brasil um gigante do petróleo

A Warren chegou a R$ 22 bi em ativos inspirada em wealth. Agora mira o trader

El-Erian alerta o Fed após dados de emprego: ‘a inflação não está morta’