Investing.com — A OpenAI revelou a família de modelos GPT-4.1—GPT-4.1, GPT-4.1 mini e GPT-4.1 nano—marcando um avanço significativo no desempenho em comparação com versões anteriores como o GPT-4o. Esses modelos foram projetados para se destacar em codificação, seguimento de instruções e compreensão de contextos longos, com suporte para até 1 milhão de tokens.
O CEO da OpenAI, Sam Altman, afirmou: "Os benchmarks são fortes, mas nos concentramos na utilidade no mundo real, e os desenvolvedores parecem muito satisfeitos."
O GPT-4.1 entrega uma pontuação de 54,6% no SWE-bench Verified, uma melhoria de 21,4% em relação ao GPT-4o, tornando-o uma escolha principal para tarefas de engenharia de software. Também pontua 38,3% no MultiChallenge da Scale e 72,0% no Video-MME, estabelecendo novos padrões em seguimento de instruções e compreensão multimodal.
Os ganhos de desempenho vêm acompanhados de eficiência: o GPT-4.1 mini reduz a latência em quase metade e diminui os custos em 83% em comparação com o GPT-4o. Apesar de seu tamanho menor, frequentemente supera o GPT-4o tanto em velocidade quanto em qualidade.
O GPT-4.1 nano, o modelo mais compacto, ainda entrega resultados sólidos com uma pontuação de 80,1% no MMLU, mantendo suporte completo para uma janela de contexto de 1 milhão de tokens. É particularmente adequado para tarefas rápidas e econômicas como classificação, autocompleção e alimentação de agentes de IA.
Os modelos são ajustados para utilidade no mundo real, incorporando feedback de desenvolvedores para melhorar a confiabilidade em aplicações práticas. Empresas como Windsurf e Qodo relatam ganhos de até 60% na eficiência de codificação e qualidade de revisão de código.
O GPT-4.1 também se destaca em contextos jurídicos e financeiros, com a Thomson Reuters (NYSE:TRI) observando um aumento de 17% na precisão de revisão de múltiplos documentos e a Carlyle relatando uma melhoria de 50% na extração de dados financeiros. Suas novas capacidades de raciocínio multi-hop, testadas no conjunto de dados Graphwalks, permitem fluxos de trabalho complexos como referência cruzada de documentos jurídicos e técnicos.
As capacidades de visão também foram aprimoradas—o GPT-4.1 mini alcança 75% no benchmark de imagem MMMU, superando o GPT-4o. O processamento de vídeo de contexto longo é outro destaque, com um salto de 6,7% sobre o GPT-4o no benchmark Video-MME.
O GPT-4.1 supostamente supera o GPT-4.5 em vários benchmarks importantes e, por sua vez, a OpenAI anunciou que descontinuará o GPT-4.5 na API da OpenAI nos próximos três meses, citando preocupações com GPU. Kevin Weil, CPO da OpenAI, chamou o GPT-4.5 de "um experimento muito bem-sucedido."
Todos os modelos GPT-4.1 estão disponíveis via API e vêm com preços competitivos, começando em US$ 0,10/US$ 0,40 por milhão de tokens para o nano. Com o GPT-4.5 Preview programado para ser descontinuado até 14.07.2025, o GPT-4.1 oferece uma solução mais poderosa e econômica para desenvolvedores e empresas.
Essa notícia foi traduzida com a ajuda de inteligência artificial. Para mais informação, veja nossos Termos de Uso.