Amazon Bedrock Intelligent Prompt Routing agora disponível para todos

Publicado 22.04.2025, 16:22
© Reuters.

Investing.com — A Amazon (NASDAQ:AMZN) anunciou a disponibilidade geral do seu Bedrock Intelligent Prompt Routing. Esta ferramenta, apresentada em dezembro, oferece um único endpoint sem servidor para direcionar efetivamente as solicitações entre diferentes modelos de fundação dentro da mesma família de modelos. Isso é feito prevendo dinamicamente a qualidade de resposta de cada modelo para uma solicitação e, em seguida, direcionando a solicitação para o modelo mais adequado com base no custo e na qualidade da resposta.

Nos últimos meses, a Amazon implementou várias melhorias no roteamento inteligente de prompts. Essas melhorias foram impulsionadas pelo feedback dos clientes e por extensos testes internos. O objetivo é facilitar o roteamento automatizado e ideal entre modelos de linguagem grandes (LLMs) através do Amazon Bedrock Intelligent Prompt Routing. Esta ferramenta possui um profundo entendimento dos comportamentos dos modelos dentro de cada família, o que inclui métodos de última geração para treinar roteadores para diferentes conjuntos de modelos, tarefas e prompts.

Os usuários agora podem usar o Amazon Bedrock Intelligent Prompt Routing com os roteadores de prompt padrão fornecidos pelo Amazon Bedrock ou configurar seus próprios roteadores de prompt. Isso permite o ajuste de desempenho linearmente entre o desempenho dos dois LLMs candidatos. Roteadores de prompt padrão são fornecidos pelo Amazon Bedrock para cada família de modelos. Esses roteadores vêm com configurações predefinidas e são projetados para funcionar imediatamente com modelos de fundação específicos. Eles oferecem uma solução direta e pronta para uso sem a necessidade de configurar quaisquer definições de roteamento.

O Amazon Bedrock Intelligent Prompt Routing agora suporta mais modelos das famílias Amazon Nova, Anthropic e Meta. Isso inclui a família Claude da Anthropic, a família Llama e a família Nova. Os usuários também podem definir suas próprias configurações de roteamento adaptadas a necessidades e preferências específicas.

A Amazon reduziu a sobrecarga de componentes adicionados em mais de 20% para aproximadamente 85 ms. Como o roteador invoca preferencialmente o modelo menos caro, mantendo a mesma precisão básica na tarefa, os usuários podem esperar um benefício geral de latência e custo em comparação com o uso constante do modelo maior e mais caro, apesar da sobrecarga adicional.

Essa notícia foi traduzida com a ajuda de inteligência artificial. Para mais informação, veja nossos Termos de Uso.

Últimos comentários

Instale nossos aplicativos
Divulgação de riscos: Negociar instrumentos financeiros e/ou criptomoedas envolve riscos elevados, inclusive o risco de perder parte ou todo o valor do investimento, e pode não ser algo indicado e apropriado a todos os investidores. Os preços das criptomoedas são extremamente voláteis e podem ser afetados por fatores externos, como eventos financeiros, regulatórios ou políticos. Negociar com margem aumenta os riscos financeiros.
Antes de decidir operar e negociar instrumentos financeiros ou criptomoedas, você deve se informar completamente sobre os riscos e custos associados a operações e negociações nos mercados financeiros, considerar cuidadosamente seus objetivos de investimento, nível de experiência e apetite de risco; além disso, recomenda-se procurar orientação e conselhos profissionais quando necessário.
A Fusion Media gostaria de lembrar que os dados contidos nesse site não são necessariamente precisos ou atualizados em tempo real. Os dados e preços disponíveis no site não são necessariamente fornecidos por qualquer mercado ou bolsa de valores, mas sim por market makers e, por isso, os preços podem não ser exatos e podem diferir dos preços reais em qualquer mercado, o que significa que são inapropriados para fins de uso em negociações e operações financeiras. A Fusion Media e quaisquer outros colaboradores/partes fornecedoras de conteúdo não são responsáveis por quaisquer perdas e danos financeiros ou em negociações sofridas como resultado da utilização das informações contidas nesse site.
É proibido utilizar, armazenar, reproduzir, exibir, modificar, transmitir ou distribuir os dados contidos nesse site sem permissão explícita prévia por escrito da Fusion Media e/ou de colaboradores/partes fornecedoras de conteúdo. Todos os direitos de propriedade intelectual são reservados aos colaboradores/partes fornecedoras de conteúdo e/ou bolsas de valores que fornecem os dados contidos nesse site.
A Fusion Media pode ser compensada pelos anunciantes que aparecem no site com base na interação dos usuários do site com os anúncios publicitários ou entidades anunciantes.
A versão em inglês deste acordo é a versão principal, a qual prevalece sempre que houver alguma discrepância entre a versão em inglês e a versão em português.
© 2007-2025 - Fusion Media Limited. Todos os direitos reservados.