Dólar cai pela 5ª sessão seguida em meio à percepção de alívio sobre impasse Brasil-EUA
Investing.com — A OpenAI lançou o GPT-4o, um gerador de imagens avançado desenvolvido para produzir visuais precisos e fotorrealistas. O novo modelo aprimora a utilidade da geração de imagens, um recurso considerado uma capacidade primária pela OpenAI.
A geração de imagens do GPT-4o foi projetada para renderizar texto com precisão, seguir comandos com exatidão e aproveitar a base de conhecimento inerente e o contexto de chat do 4o. Isso inclui a capacidade de transformar imagens carregadas ou usá-las como inspiração visual. As capacidades aprimoradas facilitam a criação da imagem exata imaginada, auxiliando assim a comunicação eficaz por meio de recursos visuais.
O modelo foi treinado na distribuição conjunta de imagens e textos online, o que resultou em um modelo visualmente fluente capaz de gerar imagens úteis, consistentes e sensíveis ao contexto. Ele se destaca na renderização de texto, geração em múltiplos turnos, seguimento de instruções, aprendizado em contexto e vinculação de conhecimento entre texto e imagens.
A capacidade de combinar símbolos precisos com imagens transforma a geração de imagens em uma ferramenta para comunicação visual. O GPT-4o pode construir a partir de imagens e textos no contexto do chat, garantindo consistência ao longo do processo. Ele também segue comandos detalhados com atenção aos detalhes e pode lidar com até 10-20 objetos diferentes.
O GPT-4o pode analisar e aprender com imagens carregadas pelos usuários, integrando perfeitamente seus detalhes em seu contexto para informar a geração de imagens. A geração nativa de imagens permite que o 4o vincule seu conhecimento entre texto e imagens, resultando em um modelo que parece mais inteligente e eficiente.
Apesar de suas capacidades avançadas, a OpenAI reconhece que o modelo tem limitações e planeja abordá-las por meio de melhorias após o lançamento inicial. A segurança continua sendo uma preocupação fundamental. A OpenAI visa maximizar a liberdade criativa, apoiando casos de uso valiosos como desenvolvimento de jogos, exploração histórica e educação, enquanto mantém padrões rigorosos de segurança.
O modelo também vem equipado com metadados C2PA, que identificam uma imagem como proveniente do GPT-4o, para proporcionar transparência. A OpenAI construiu uma ferramenta de busca interna que usa atributos técnicos das gerações para ajudar a verificar se o conteúdo veio de seu modelo.
A implementação da geração de imagens do 4o começa hoje para usuários Plus, Pro, Team e Free como o gerador de imagens padrão no ChatGPT, com acesso em breve para Enterprise e Edu. Os desenvolvedores poderão em breve gerar imagens com o GPT-4o via API, com acesso sendo implementado nas próximas semanas.
Criar e personalizar imagens com o GPT-4o é tão simples quanto conversar. Os usuários só precisam descrever o que necessitam, incluindo especificações como proporção, cores exatas usando códigos hexadecimais ou um fundo transparente. A renderização das imagens leva até um minuto devido à natureza detalhada das figuras.
Essa notícia foi traduzida com a ajuda de inteligência artificial. Para mais informação, veja nossos Termos de Uso.