Anthropic lança modelos Claude 4, estabelecendo novo padrão em desempenho de IA

Publicado 22.05.2025, 13:48
© Reuters

Investing.com — A Anthropic revelou o Claude 4, sua geração mais avançada de modelos de IA até o momento, sinalizando um passo ousado em sua corrida contra OpenAI, Alphabet Inc Class A (NASDAQ:GOOGL) e xAI. O lançamento apresenta o Claude Opus 4 e o Claude Sonnet 4, ambos elevando o padrão para raciocínio de IA, capacidades de codificação e desempenho agêntico sustentado.

O Claude Opus 4, agora considerado o melhor modelo de codificação do mundo, entrega um recorde de 72,5% no SWE-bench e 43,2% no Terminal-bench, superando todos os concorrentes em fluxos de trabalho de agentes complexos e de longa duração. Paralelamente, o Sonnet 4 completa a oferta com tempos de resposta mais rápidos e alinhamento aprimorado, mostrando ganhos significativos em relação ao seu antecessor Sonnet 3.7, incluindo um equivalente 72,7% no SWE-bench.

"O Claude Opus 4 se destaca na resolução de desafios complexos que outros modelos não conseguem", relatou a Cognition, parceira de integração do Claude, destacando sua durabilidade superior durante tarefas computacionais de horas. A Rakuten validou sua força com uma tarefa de refatoração de agente único que funcionou por sete horas sem degradação de desempenho, um dos vários indicadores de que o Claude está ampliando a fronteira do que a IA pode lidar autonomamente.

Além do desempenho bruto em benchmarks, ambos os modelos introduzem novas capacidades críticas para aplicações agênticas. Entre elas: pensamento estendido com uso de ferramentas, melhorias de memória para continuidade baseada em arquivos locais e uma redução de 65% em atalhos ou comportamentos de brechas em comparação com o Sonnet 3.7, uma preocupação contínua para IA implantada em fluxos de trabalho sensíveis ou críticos.

A Anthropic também lançou formalmente o Claude Code, seu assistente de fluxo de trabalho de desenvolvimento, para disponibilidade geral. O sistema se integra perfeitamente com JetBrains e VS Code, fornecendo execução em segundo plano com GitHub Actions e novo suporte SDK para alimentar ferramentas de desenvolvedor de IA personalizadas. O GitHub já anunciou planos para basear seu agente de codificação Copilot de próxima geração no Claude Sonnet 4, citando "excelência em cenários agênticos".

A plataforma Claude 4 introduz flexibilidade em níveis com dois modos de raciocínio distintos: respostas quase instantâneas para retornos mais rápidos e pensamento estendido para tarefas que exigem análise mais profunda. Tanto o Opus 4 quanto o Sonnet 4 estão acessíveis via API da Anthropic, Amazon (NASDAQ:AMZN) Bedrock e Vertex (NASDAQ:VRTX) AI do Google, com preços mantidos em US$ 15 e US$ 75 por milhão de tokens para entrada e saída do Opus, e US$ 3/US$ 15 para o Sonnet.

Esses avanços dão à Anthropic uma vantagem técnica convincente sobre seus rivais, muitos dos quais também estão em busca de agentes multimodais seguros, mas capazes. "Esses modelos são um grande passo em direção ao colaborador virtual — mantendo contexto completo, sustentando foco em projetos mais longos e impulsionando impacto transformacional", disse a Anthropic em seu comunicado.

Com uma equipe de liderança formada por ex-pesquisadores da OpenAI, a Anthropic tem enfatizado consistentemente a segurança junto com a capacidade, um posicionamento que pode ressoar com compradores empresariais cautelosos com comportamentos de modelo não verificados. Espera-se que os últimos modelos Claude, combinados com ferramentas de agente aprimoradas e fluxos de trabalho ricos em memória, acelerem sua adoção em ecossistemas comerciais e de desenvolvedores.

Essa notícia foi traduzida com a ajuda de inteligência artificial. Para mais informação, veja nossos Termos de Uso.

Últimos comentários

Instale nossos aplicativos
Divulgação de riscos: Negociar instrumentos financeiros e/ou criptomoedas envolve riscos elevados, inclusive o risco de perder parte ou todo o valor do investimento, e pode não ser algo indicado e apropriado a todos os investidores. Os preços das criptomoedas são extremamente voláteis e podem ser afetados por fatores externos, como eventos financeiros, regulatórios ou políticos. Negociar com margem aumenta os riscos financeiros.
Antes de decidir operar e negociar instrumentos financeiros ou criptomoedas, você deve se informar completamente sobre os riscos e custos associados a operações e negociações nos mercados financeiros, considerar cuidadosamente seus objetivos de investimento, nível de experiência e apetite de risco; além disso, recomenda-se procurar orientação e conselhos profissionais quando necessário.
A Fusion Media gostaria de lembrar que os dados contidos nesse site não são necessariamente precisos ou atualizados em tempo real. Os dados e preços disponíveis no site não são necessariamente fornecidos por qualquer mercado ou bolsa de valores, mas sim por market makers e, por isso, os preços podem não ser exatos e podem diferir dos preços reais em qualquer mercado, o que significa que são inapropriados para fins de uso em negociações e operações financeiras. A Fusion Media e quaisquer outros colaboradores/partes fornecedoras de conteúdo não são responsáveis por quaisquer perdas e danos financeiros ou em negociações sofridas como resultado da utilização das informações contidas nesse site.
É proibido utilizar, armazenar, reproduzir, exibir, modificar, transmitir ou distribuir os dados contidos nesse site sem permissão explícita prévia por escrito da Fusion Media e/ou de colaboradores/partes fornecedoras de conteúdo. Todos os direitos de propriedade intelectual são reservados aos colaboradores/partes fornecedoras de conteúdo e/ou bolsas de valores que fornecem os dados contidos nesse site.
A Fusion Media pode ser compensada pelos anunciantes que aparecem no site com base na interação dos usuários do site com os anúncios publicitários ou entidades anunciantes.
A versão em inglês deste acordo é a versão principal, a qual prevalece sempre que houver alguma discrepância entre a versão em inglês e a versão em português.
© 2007-2025 - Fusion Media Limited. Todos os direitos reservados.