A OpenAI anunciou nesta 2ª feira (25.set.2023) que os usuários do ChatGPT Plus e usuários corporativos poderão ter um assistente de voz virtual. O recurso estará disponível a partir de outubro.
Segundo a empresa, o assistente virtual terá 5 vozes diferentes e o recurso whisper, um sistema de reconhecimento de fala de código para transcrever a fala em texto.
“A nova capacidade de voz é alimentada por um novo modelo de conversão de texto em fala, capaz de gerar áudio semelhante ao humano a partir de apenas texto e alguns segundos de amostra de fala. Colaboramos com dubladores profissionais para criar cada uma das vozes”, declarou a empresa.
Um sistema de reconhecimento de imagem também será lançado. Os usuários poderão tirar uma foto e solicitar algum comando diante da imagem, como fotografar um exercício matemático, e a IA enviará a resolução.
A empresa afirmou que, até o momento, as novas ferramentas podem transcrever textos em inglês, mas tem um desempenho fraco com alguns outros idiomas, principalmente os de escrita não romana.
“Aconselhamos nossos usuários que não falam inglês a não usar o ChatGPT para essa finalidade”, afirmou a OpenAI.
A OpenAI espera que a atualização concorra com assistentes de voz pessoais como a Siri, da Apple (NASDAQ:AAPL), e a Alexa, da Amazon (NASDAQ:AMZN).