Por que o preço do café disparou em agosto nos mercados internacionais?
Investing.com — A Anthropic revelou o Claude 4, sua geração mais avançada de modelos de IA até o momento, sinalizando um passo ousado em sua corrida contra OpenAI, Alphabet Inc Class A (NASDAQ:GOOGL) e xAI. O lançamento apresenta o Claude Opus 4 e o Claude Sonnet 4, ambos elevando o padrão para raciocínio de IA, capacidades de codificação e desempenho agêntico sustentado.
O Claude Opus 4, agora considerado o melhor modelo de codificação do mundo, entrega um recorde de 72,5% no SWE-bench e 43,2% no Terminal-bench, superando todos os concorrentes em fluxos de trabalho de agentes complexos e de longa duração. Paralelamente, o Sonnet 4 completa a oferta com tempos de resposta mais rápidos e alinhamento aprimorado, mostrando ganhos significativos em relação ao seu antecessor Sonnet 3.7, incluindo um equivalente 72,7% no SWE-bench.
"O Claude Opus 4 se destaca na resolução de desafios complexos que outros modelos não conseguem", relatou a Cognition, parceira de integração do Claude, destacando sua durabilidade superior durante tarefas computacionais de horas. A Rakuten validou sua força com uma tarefa de refatoração de agente único que funcionou por sete horas sem degradação de desempenho, um dos vários indicadores de que o Claude está ampliando a fronteira do que a IA pode lidar autonomamente.
Além do desempenho bruto em benchmarks, ambos os modelos introduzem novas capacidades críticas para aplicações agênticas. Entre elas: pensamento estendido com uso de ferramentas, melhorias de memória para continuidade baseada em arquivos locais e uma redução de 65% em atalhos ou comportamentos de brechas em comparação com o Sonnet 3.7, uma preocupação contínua para IA implantada em fluxos de trabalho sensíveis ou críticos.
A Anthropic também lançou formalmente o Claude Code, seu assistente de fluxo de trabalho de desenvolvimento, para disponibilidade geral. O sistema se integra perfeitamente com JetBrains e VS Code, fornecendo execução em segundo plano com GitHub Actions e novo suporte SDK para alimentar ferramentas de desenvolvedor de IA personalizadas. O GitHub já anunciou planos para basear seu agente de codificação Copilot de próxima geração no Claude Sonnet 4, citando "excelência em cenários agênticos".
A plataforma Claude 4 introduz flexibilidade em níveis com dois modos de raciocínio distintos: respostas quase instantâneas para retornos mais rápidos e pensamento estendido para tarefas que exigem análise mais profunda. Tanto o Opus 4 quanto o Sonnet 4 estão acessíveis via API da Anthropic, Amazon (NASDAQ:AMZN) Bedrock e Vertex (NASDAQ:VRTX) AI do Google, com preços mantidos em US$ 15 e US$ 75 por milhão de tokens para entrada e saída do Opus, e US$ 3/US$ 15 para o Sonnet.
Esses avanços dão à Anthropic uma vantagem técnica convincente sobre seus rivais, muitos dos quais também estão em busca de agentes multimodais seguros, mas capazes. "Esses modelos são um grande passo em direção ao colaborador virtual — mantendo contexto completo, sustentando foco em projetos mais longos e impulsionando impacto transformacional", disse a Anthropic em seu comunicado.
Com uma equipe de liderança formada por ex-pesquisadores da OpenAI, a Anthropic tem enfatizado consistentemente a segurança junto com a capacidade, um posicionamento que pode ressoar com compradores empresariais cautelosos com comportamentos de modelo não verificados. Espera-se que os últimos modelos Claude, combinados com ferramentas de agente aprimoradas e fluxos de trabalho ricos em memória, acelerem sua adoção em ecossistemas comerciais e de desenvolvedores.
Essa notícia foi traduzida com a ajuda de inteligência artificial. Para mais informação, veja nossos Termos de Uso.