GPT-4o, o mais recente modelo carro-chefe da OpenAI, recebeu sentimentos mistos dos usuários. Enquanto alguns estão impressionados com a sua velocidade e capacidades multimodais, outros estão desapontados pelo facto de não apresentar melhorias na inteligência e no raciocínio em relação ao GPT-4. Mas quer você seja um time “surpreso” ou um time “meh”, ainda é difícil ignorar o fato de que as capacidades multimodais do GPT-4o são uma virada de jogo.
Aqui estão algumas maneiras pelas quais o GPT-4o poderá ajudá-lo depois que a OpenAI lançar os novos recursos de voz e visão.
Parceiro/Tutor de Aprendizagem
Com as habilidades do GPT-40, pode ser o parceiro de aprendizagem ou tutor perfeito. Você pode usá-lo para aprender idiomas ou obter ajuda para resolver problemas de matemática. Você pode apontar objetos para obter ajuda no aprendizado de um idioma ou compartilhar suas questões de matemática com eles. Ele não apenas fornecerá as respostas ou fará sua lição de casa.
https://www.youtube.com/watch?v=_nSmkyDNulk
Ele pode criar uma série de perguntas para ajudá-lo a entender o conceito e chegar sozinho à parte de solução do problema, como um verdadeiro tutor. Além disso, com as suas capacidades avançadas, é capaz de lidar com uma situação “empaticamente”. Assim, enquanto dá aulas particulares, ele pode demonstrar incrível paciência e empatia, empurrando você na direção certa, sem ficar frustrado. Para muitas pessoas, às vezes isso pode ser bastante difícil de conseguir na vida real.
As outras aplicações futuras serão ainda mais intrigantes, se você pudesse usar o GPT-4o em óculos inteligentes (tomando a ideia do Projeto Astra do Google) para ter sempre seu parceiro de aprendizagem ao seu lado.
Obtenha ajuda com a preparação para entrevistas
ChatGPT, quando desenvolvido com GPT-4o, pode ser o parceiro definitivo na preparação para entrevistas. Embora você já pudesse simular uma conversa com o ChatGPT para se preparar para uma entrevista e isso pudesse ajudar a acertar os aspectos técnicos dela de maneira fantástica, o processo não foi tão natural por causa de fatores como latência e ausência de multimodalidade no núcleo do ChatGPT.
Mas com suas capacidades aprimoradas de raciocínio por voz e visão, ele pode ir um passo além para ajudá-lo. Para começar, com sua nova capacidade de “ver” você, ele pode até te orientar na parte estética da preparação para a entrevista, como o traje.
https://www.youtube.com/watch?v=wfAYBdaGVxs
No entanto, as implicações são muito mais impactantes. Com suas capacidades visuais e capacidade de interpretar emoções humanas, ele pode até fornecer feedback sobre sua linguagem corporal, como um verdadeiro treinador.
Assistente de Reunião
O ChatGPT pode participar de suas reuniões, ouvir suas ligações, transcrever, resumir e até apresentar suas opiniões, tudo em tempo real, como um verdadeiro assistente.
Você pode perguntar o que foi discutido na teleconferência, qual a opinião de cada pessoa sobre determinado ponto de vista, identificar pontos de vista conflitantes, trabalhar em problemas de análise de dados, consultar determinadas informações e muito mais.
Tradutor de linguagem pessoal
GPT-4o pode ser um excelente assistente de tradução de idiomas. Ele pode traduzir uma conversa em tempo real, sem a necessidade de repeti-la várias vezes. Assim, você pode ter uma conversa normal em diferentes idiomas, e sempre que um palestrante terminar de falar, o ChatGPT traduzirá para o segundo idioma.
Em que difere de usar o Google Tradutor ou qualquer outra ferramenta de tradução? Além do fato de que você não precisa ativar a tradução todas as vezes e isso mantém a conversa natural, a capacidade do GPT-4o de entender a entonação por trás das palavras significa que menos se perde na tradução.
Assistente de acessibilidade para cegos
ChatGPT-4o, com seus recursos de visão, pode ajudar os deficientes visuais, observando o que está ao seu redor e descrevendo tudo para você.
https://www.youtube.com/watch?v=KwNUJ69RbwY
Embora pareça bastante ambicioso em seu estado atual, imagine as implicações se você pudesse ter o GPT-4o em óculos inteligentes, como os óculos Meta Rayban, onde o GPT-4o poderia literalmente ser os olhos de uma pessoa com deficiência visual. Mesmo em sua forma atual, é incrível que as pessoas possam apontar a câmera de seus telefones para algo e fornecer todos os detalhes.
Se o ChatGPT pudesse se tornar capaz de interpretar a linguagem de sinais, poderia até ajudar pessoas surdas no futuro.
Capacidades de monitoramento
O ChatGPT-4o pode “potencialmente” ser usado para monitorar crianças, animais de estimação, doentes e idosos, ou mesmo apenas coisas como portas de entrada, etc. Imagine que você precisa se afastar por um momento e deseja que alguém monitore seu filho ou animal de estimação e alertá-lo imediatamente se eles estiverem envolvidos em atividades perigosas (que você pode definir).
Embora demore algum tempo até que você possa confiar na IA para não cometer erros e fornecer resultados confiáveis sempre, é definitivamente um caso de uso possível e interessante para o futuro.
Assistente de codificação
Com o ChatGPT sendo capaz de acessar sua tela com compartilhamento de tela, você pode ter um assistente de codificação ao seu lado e orientá-lo durante todo o processo. Embora também seja útil com outros aplicativos, com os recursos aprimorados de codificação do GPT-4o, obter ajuda na codificação será o melhor aplicativo.
Análise de dados
O GPT-4o tem melhorias surpreendentes na velocidade em relação ao GPT-4 Turbo e também traz essa velocidade para a análise de dados. Ele pode processar planilhas, analisar dados e até criar diagramas, gráficos e tabelas estatísticas em menos de 30 segundos.
Criação de modelos 3D
O GPT-4o pode até criar arquivos STL para modelos 3D a partir de prompts de texto únicos, acelerando o processo de visualização e prototipagem. Então, se você deseja agilizar seu fluxo de trabalho ou se não possui o conhecimento técnico necessário para esta tarefa, o ChatGPT pode te ajudar!
Usei o GPT-4o para criar um arquivo STL para o modelo 3D em aproximadamente 20 segundos no meu telefone. É notável o que você pode gerar com IA e prompt simples agora. pic.twitter.com/2fbObrpPol
-Min Choi (@minchoi) 14 de maio de 2024
Criando Personagens Consistentes
A OpenAI introduziu os recursos de geração de imagens do DALL-E no ChatGPT há algum tempo. Mas com o GPT-4o, você pode criar várias imagens do mesmo personagem enquanto mantém a consistência do personagem. Então, agora você pode usar o ChatGPT para criar personagens consistentes para suas histórias e pode criar imagens deles em diferentes ações.
Transcrever notas manuscritas
Com os recursos aumentados do GPT-4o em reconhecimento de imagem, ele agora pode transcrever melhor notas manuscritas. Você pode usá-lo para digitalizar suas anotações escolares ou universitárias. Ele ainda demonstra incríveis capacidades de transcrição ao manusear cartas manuscritas do século XVIII. Portanto, embora haja erros, isso também agilizará todo o processo exponencialmente!
GPT-4o é verdadeiramente notável na 18ª caligrafia. Entreguei-lhe a seguinte carta e pedi uma transcrição. Alguns pequenos erros…incrível! pic.twitter.com/3JevZvd5p5
– História Generativa (@HistoryGPT) 14 de maio de 2024
Embora o GPT-4o não seja uma grande atualização em relação ao GPT-4 em termos de inteligência e raciocínio, também não é uma atualização pequena, de forma alguma. Mesmo que você seja alguém mais assustado com seu antropomorfismo ou suas semelhanças com AI in Her de Scarlett Johannsen, você não pode negar que o fato de ter se tornado mais inteligente será útil em termos práticos.
No entanto, há também outro fato que não pode ser esquecido ao considerar as aplicações práticas do GPT-4o – a janela de contexto de 128K do ChatGPT. Com uma janela de contexto limitada, o ChatGPT só pode ser útil em cenários como assistente de reunião ou tradutor de idiomas. A questão de quanto tempo na reunião/conversa a janela de contexto do ChatGPT se esgotaria é extremamente válida. Há também a questão dos limites de uso limitados para o GPT-4o.
Deixe um comentário