OpenAI lança GPT-4o para geração de imagens precisas e fotorrealistas

Publicado 25.03.2025, 21:54
© Reuters

Investing.com — A OpenAI lançou o GPT-4o, um gerador de imagens avançado desenvolvido para produzir visuais precisos e fotorrealistas. O novo modelo aprimora a utilidade da geração de imagens, um recurso considerado uma capacidade primária pela OpenAI.

A geração de imagens do GPT-4o foi projetada para renderizar texto com precisão, seguir comandos com exatidão e aproveitar a base de conhecimento inerente e o contexto de chat do 4o. Isso inclui a capacidade de transformar imagens carregadas ou usá-las como inspiração visual. As capacidades aprimoradas facilitam a criação da imagem exata imaginada, auxiliando assim a comunicação eficaz por meio de recursos visuais.

O modelo foi treinado na distribuição conjunta de imagens e textos online, o que resultou em um modelo visualmente fluente capaz de gerar imagens úteis, consistentes e sensíveis ao contexto. Ele se destaca na renderização de texto, geração em múltiplos turnos, seguimento de instruções, aprendizado em contexto e vinculação de conhecimento entre texto e imagens.

A capacidade de combinar símbolos precisos com imagens transforma a geração de imagens em uma ferramenta para comunicação visual. O GPT-4o pode construir a partir de imagens e textos no contexto do chat, garantindo consistência ao longo do processo. Ele também segue comandos detalhados com atenção aos detalhes e pode lidar com até 10-20 objetos diferentes.

O GPT-4o pode analisar e aprender com imagens carregadas pelos usuários, integrando perfeitamente seus detalhes em seu contexto para informar a geração de imagens. A geração nativa de imagens permite que o 4o vincule seu conhecimento entre texto e imagens, resultando em um modelo que parece mais inteligente e eficiente.

Apesar de suas capacidades avançadas, a OpenAI reconhece que o modelo tem limitações e planeja abordá-las por meio de melhorias após o lançamento inicial. A segurança continua sendo uma preocupação fundamental. A OpenAI visa maximizar a liberdade criativa, apoiando casos de uso valiosos como desenvolvimento de jogos, exploração histórica e educação, enquanto mantém padrões rigorosos de segurança.

O modelo também vem equipado com metadados C2PA, que identificam uma imagem como proveniente do GPT-4o, para proporcionar transparência. A OpenAI construiu uma ferramenta de busca interna que usa atributos técnicos das gerações para ajudar a verificar se o conteúdo veio de seu modelo.

A implementação da geração de imagens do 4o começa hoje para usuários Plus, Pro, Team e Free como o gerador de imagens padrão no ChatGPT, com acesso em breve para Enterprise e Edu. Os desenvolvedores poderão em breve gerar imagens com o GPT-4o via API, com acesso sendo implementado nas próximas semanas.

Criar e personalizar imagens com o GPT-4o é tão simples quanto conversar. Os usuários só precisam descrever o que necessitam, incluindo especificações como proporção, cores exatas usando códigos hexadecimais ou um fundo transparente. A renderização das imagens leva até um minuto devido à natureza detalhada das figuras.

 

Essa notícia foi traduzida com a ajuda de inteligência artificial. Para mais informação, veja nossos Termos de Uso.

Últimos comentários

Instale nossos aplicativos
Divulgação de riscos: Negociar instrumentos financeiros e/ou criptomoedas envolve riscos elevados, inclusive o risco de perder parte ou todo o valor do investimento, e pode não ser algo indicado e apropriado a todos os investidores. Os preços das criptomoedas são extremamente voláteis e podem ser afetados por fatores externos, como eventos financeiros, regulatórios ou políticos. Negociar com margem aumenta os riscos financeiros.
Antes de decidir operar e negociar instrumentos financeiros ou criptomoedas, você deve se informar completamente sobre os riscos e custos associados a operações e negociações nos mercados financeiros, considerar cuidadosamente seus objetivos de investimento, nível de experiência e apetite de risco; além disso, recomenda-se procurar orientação e conselhos profissionais quando necessário.
A Fusion Media gostaria de lembrar que os dados contidos nesse site não são necessariamente precisos ou atualizados em tempo real. Os dados e preços disponíveis no site não são necessariamente fornecidos por qualquer mercado ou bolsa de valores, mas sim por market makers e, por isso, os preços podem não ser exatos e podem diferir dos preços reais em qualquer mercado, o que significa que são inapropriados para fins de uso em negociações e operações financeiras. A Fusion Media e quaisquer outros colaboradores/partes fornecedoras de conteúdo não são responsáveis por quaisquer perdas e danos financeiros ou em negociações sofridas como resultado da utilização das informações contidas nesse site.
É proibido utilizar, armazenar, reproduzir, exibir, modificar, transmitir ou distribuir os dados contidos nesse site sem permissão explícita prévia por escrito da Fusion Media e/ou de colaboradores/partes fornecedoras de conteúdo. Todos os direitos de propriedade intelectual são reservados aos colaboradores/partes fornecedoras de conteúdo e/ou bolsas de valores que fornecem os dados contidos nesse site.
A Fusion Media pode ser compensada pelos anunciantes que aparecem no site com base na interação dos usuários do site com os anúncios publicitários ou entidades anunciantes.
A versão em inglês deste acordo é a versão principal, a qual prevalece sempre que houver alguma discrepância entre a versão em inglês e a versão em português.
© 2007-2025 - Fusion Media Limited. Todos os direitos reservados.