Principais insights
- Quatro novas vozes oferecem mais opções, incluindo um sotaque britânico semelhante ao de Karl Urban
- Advanced Voice oferece uma experiência de bate-papo mais natural com respostas instantâneas e capacidade de interromper
- A modulação da voz para diferentes tons e estilos é muito impressionante
Depois de esperar mais do que o esperado, o modo Advanced Voice é ativado Bate-papoGPT finalmente foi implementado para a maioria dos assinantes do ChatGPT Plus. O Recurso de voz no ChatGPT já permite que você interaja com o ChatGPT usando apenas sua voz e tenha as respostas faladas para você. Com o recurso de voz atualizado, agora você pode falar com o Aplicativo ChatGPT de uma forma muito mais natural, com reações quase instantâneas e vozes ainda mais naturais.
O recurso foi apresentado pela primeira vez em maio e os usuários aguardavam ansiosamente seu lançamento, com alguns sortudos obtendo acesso antecipado nas últimas semanas. Com o recurso finalmente sendo lançado para todos ChatGPT Plus Para os usuários, experimentei o Advanced Voice para ver se ele cumpre o que promete.
As novas vozes oferecem muito mais opções
O céu pode ter desaparecido, mas existem algumas boas alternativas
É justo dizer que, apesar do sucesso, a OpenAI cometeu alguns erros ao longo do caminho. Uma das mais dramáticas foi a criação de uma voz para ChatGPT que parecia mais do que a atriz Scarlett Johansson, que interpretou a voz de um chatbot de IA no filme Her. Aparentemente, a OpenAI abordou Johansson sobre o uso de sua voz, mas quando ela recusou, eles usaram uma que parecia muito com ela de qualquer maneira. Graças aos seus advogados, a voz Sky não está mais disponível, o que é uma pena porque era de longe a minha voz preferida.
Felizmente, agora temos quatro novas vozes juntando-se às vozes existentes Ember, Juniper, Cove e Breeze. Arbor é um sotaque britânico masculino que soa um pouco como o sotaque cockney um pouco estranho de Karl Urban no excelente programa do Amazon Prime Os meninos. No entanto, Arbor não tem exatamente o mesmo vocabulário. Spruce é uma voz “calma e afirmativa”, que lembra um pouco a de Morgan Freeman. Sol tem um sotaque feminino com um toque de garota do vale, e se você pedir a ela para falar como uma garota do vale, ela realmente consegue.
Minha voz favorita, porém, é a Vale. É um sotaque britânico feminino e é como ter sua própria versão de Mary Poppins para conversar. As vozes são excelentes e oferecem muito mais opções do que antes.
Os tempos de resposta e o tom de voz são excelentes
Realmente parece uma conversa natural
Esta é a maior mudança no Advanced Voice; Os longos atrasos à espera de uma resposta desapareceram completamente. Você não precisa mais assistir à animação na tela enquanto o ChatGPT pensa em uma resposta; A resposta é imediata, como se você estivesse falando com outra pessoa.
Realmente faz uma grande diferença. Conversar com o ChatGPT nunca pareceu uma conversa real por causa das pausas longas e não naturais, mas agora as idas e vindas são tão instantâneas que é fácil esquecer que você está falando com um software.
Conversar com o ChatGPT nunca pareceu uma conversa real por causa das pausas longas e não naturais, mas agora as idas e vindas são tão instantâneas que é fácil esquecer que você está falando com um software.
A capacidade de interromper também ajuda; Você pode falar enquanto o ChatGPT fala e a fala para enquanto o aplicativo ouve o que você diz. Isso é especialmente útil quando o ChatGPT dá uma resposta longa e fora do assunto e você deseja colocar as coisas de volta nos trilhos. Também parece muito natural, embora um pouco rude, já que você está falando de outra pessoa, por assim dizer.
A capacidade de falar com diferentes tipos de voz é impressionante
ChatGPT pode fornecer uma voz de troll melhor do que a minha
Outra capacidade verdadeiramente impressionante do Advanced Voice é a maneira como todas as opções de voz podem alterar o tom ou estilo de sua voz para atender às suas necessidades específicas ou simplesmente se adaptar ao contexto do que está sendo dito. Depois que pedi ao ChatGPT para me contar uma piada original, a resposta foi terrível e eu contei ao ChatGPT. ChatGPT respondeu dizendo: “Sim, isso realmente entrou no território das piadas de pai!” Mas pela forma como a frase foi formulada, você quase poderia imaginar alguém falando e fazendo uma cara divertida e envergonhada.
O que foi ainda mais impressionante foi quando pedi ao ChatGPT que me contasse a história de Three Billy Goats Gruff, usando vozes diferentes para cada um dos personagens. ChatGPT usou uma voz suave e aguda para a cabra menor e uma voz profunda e estrondosa para o troll. Foi certeiro e honestamente senti como se estivesse ouvindo uma pessoa real contando a história.
ChatGPT não é mais inteligente
Aparentemente ainda existem dois Rs no Strawberry
Embora os recursos de voz do ChatGPT tenham dado um grande salto, os recursos inteligentes do ChatGPT não. Tive uma longa conversa com o ChatGPT Voice para tentar me dar a resposta certa para uma pergunta simples que confunde a maioria dos chatbots de IA: Quantas vezes a letra R aparece na palavra morango? Quase todos Chatbots de IA Responda a duas dessas perguntas.
Quando perguntei ao Advanced Voice, recebi a mesma resposta errada. Tentei fazer com que o ChatGPT soletrasse a palavra uma letra por vez e depois contasse os Rs, mas ainda assim dizia dois. Pedi para ele soletrar a palavra novamente, uma letra de cada vez, somando uma ao total cada vez que a letra era um R, e quase funcionou, mas ao contar, algumas letras de Strawberry foram perdidas. Depois de finalmente tentar novamente, ele conseguiu uma resposta três.
O novo modelo o1 da OpenAI, capaz de inferências muito mais complexas, pode responder a esta questão, embora ainda demore alguns segundos. No entanto, você não pode usar o1 com voz. Sempre se utiliza GPT-4 ou GPT-4o, que são menos capazes de raciocinar.
Alguns usuários Plus ainda não conseguem usar o Advanced Voice
A UE, a Grã-Bretanha e outros terão de continuar a esperar
Nem todos com assinatura do ChatGPT Plus têm acesso ao novo recurso Advanced Voice. A página de perguntas frequentes do novo recurso afirma que o Advanced Voice ainda não está disponível na UE, Reino Unido, Suíça, Islândia, Noruega e Liechtenstein. A Islândia, o Liechtenstein, a Noruega e a Suíça fazem parte da Associação Europeia de Comércio Livre, que funciona paralelamente à UE, e o Reino Unido fez parte da UE até 2020, pelo que é muito provável que isto esteja relacionado com as leis de protecção de dados da UE. A palavra “ainda” parece indicar que o recurso estará disponível nesses países em algum momento no futuro.
Alguns usuários nesses países relataram conseguir acessar o Advanced Voice através do Usando uma VPNembora não esteja claro se isso viola os termos de serviço. É compreensivelmente frustrante para os usuários desses países, pois em nenhum momento antes do lançamento do Advanced Voice foi mencionado que esses países não teriam acesso, e muitos usuários dessas regiões pagaram por suas assinaturas do ChatGPT Plus exatamente por esse motivo.
ChatGPT ainda carece de alguns de seus melhores recursos
É um grande salto para a voz, mas ainda estamos aguardando o vídeo
OpenAI
Não há como negar que o Advanced Voice representa um grande avanço para a interação por voz no ChatGPT. Graças às respostas instantâneas e à capacidade de ajustar o tom de voz com base no contexto, usar o novo recurso é realmente como conversar com outra pessoa.
Ao pesquisar como as pessoas usam o ChatGPTDescobri que muitas pessoas usam isso como fonte de apoio emocional, já que você pode conversar com o ChatGPT sem julgamento. O novo Advanced Voice parece muito mais com uma pessoa real, e isso significa que é ainda mais provável que seja útil para pessoas que estão simplesmente procurando alguém com quem conversar.
No entanto, demoramos muito para chegar a este ponto. A OpenAI apresentou uma demonstração do recurso Advanced Voice em maio, prometendo que o recurso seria lançado “nas próximas semanas”. Já se passaram mais de quatro meses e o Advanced Voice acaba de chegar.
Também vimos algumas demonstrações ainda mais impressionantes em maio, incluindo a capacidade de perguntar ao ChatGPT o que você pode ver ao seu redor usando uma transmissão ao vivo de sua câmera. É muito provável que não veremos esse recurso tão cedo.