ChatGPT-4o é incrivelmente bom, ele vai rir e cantar com você “em um chat de vídeo”

ChatGPT-4o é incrivelmente bom, ele vai rir e cantar com você “em um chat de vídeo”

Se você estivesse aguardando ansiosamente a última atualização do Spring do OpenAI para ChatGPT e esperando que a empresa lançasse o GPT-5, você ficaria desapontado a esse respeito. Mas o que a OpenAI lançou mais do que compensaria.

A empresa revelou recentemente o seu mais novo modelo principal – GPT-4o – e é uma obra-prima da inovação humana. O ‘o’ em GPT-4o significa “omni” e é uma referência adequada aos mais novos recursos onipresentes do ChatGPT. Embora não haja muitas melhorias na parte de inteligência e raciocínio em relação ao modelo GPT-4, o novo modelo apresenta melhorias drásticas na velocidade e na multimodalidade.

O que isso significa? O GPT-4o melhorou os recursos de texto, voz e visão. Ele pode compreender e discutir melhor as imagens. Mas a parte mais interessante da atualização é a capacidade de conversar com você em tempo real por áudio e vídeo, conduzindo-nos ao futuro da interação homem-máquina. A maioria de nós apenas imaginou essa interação de ficção científica com uma IA no futuro. Mas está aqui e é emocionante.

Mira Murati, CTO da OpenAI, juntamente com dois líderes de pesquisa, apresentaram os novos recursos do GPT-40.

O modelo de voz tem personalidade e tonalidade incríveis, capazes de fazer você esquecer (por um tempo) que está interagindo com uma IA. É assustadoramente emocionante. As respostas são muito mais naturais e ele até ri e finge corar como um humano.

A demonstração também destacou a gama de emoções que o ChatGPT pode exibir quando solicitado explicitamente: ao narrar uma história, o ChatGPT absorveu sua voz com mais emoções e drama, mudou para um som robótico e até cantou como se estivesse em um musical, e fez isso. tudo perfeitamente.

Muitos usuários dizem que a voz os lembra da IA ​​de Scarlett Johansson do filme “Her”, mas, notavelmente, é a mesma voz que o ChatGPT tinha no passado. Toda a diferença vem das mudanças de tonalidade e de algumas risadas bem colocadas.

Quando você o combina com suas habilidades de ver e responder ao conteúdo da tela, é absolutamente alucinante. Com seus novos recursos de visão, o ChatGPT poderia não apenas compreender coisas como equações lineares, mas também fez um excelente trabalho de interpretação do ambiente, bem como das emoções no rosto de uma pessoa mostradas usando a câmera. Agora você pode até jogar pedra-papel-tesoura e pedir ao ChatGPT para ser o árbitro ou levar a preparação para a entrevista com o ChatGPT um passo adiante, pedindo-lhe para criticar sua roupa, e isso não irá encobrir quaisquer escolhas erradas que você fizer.

No geral, o efeito é notável e quase faz você acreditar que está interagindo com uma pessoa real por meio de uma videochamada (isto é, se a outra pessoa mantivesse a câmera desligada o tempo todo).

https://www.youtube.com/watch?v=DQacCB9tDaw

O modelo de voz também é melhor no geral do que o disponível atualmente. O diálogo flui mais como uma conversa natural, onde você pode interrompê-la no meio, consegue entender e diferenciar múltiplas vozes e ruídos de fundo, e o tom da voz.

A nível técnico, é porque o GPT-4o pode fazer nativamente tudo o que até agora exigia três modelos diferentes: Transcrição, Inteligência e Text-to-Speech. Essas melhorias trazem ao usuário uma experiência mais imersiva e colaborativa em vez das latências dos modelos anteriores.

Embora o acesso ao GPT-4o já esteja começando a ser implementado para usuários gratuitos e Plus no aplicativo da web, o novo modo de voz com GPT-4o será lançado em alfa apenas para usuários do ChatGPT Plus nas próximas semanas. Um novo aplicativo macOS ChatGPT também está sendo lançado, com acesso implementado de forma iterativa, começando pelos usuários do ChatGPT Plus.

Embora a demonstração tenha sido bastante impressionante, teremos que esperar para ver se a aplicação no mundo real será tão suave quando o modelo for finalmente lançado.

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *