Alibaba lança série Qwen3-Embedding e Qwen3-Reranker para incorporação de texto multilíngue

Publicado 06.06.2025, 10:14
© Reuters.

A Alibaba (NYSE:BABA) lançou a série Qwen3-Embedding e Qwen3-Reranker, estabelecendo novos padrões em incorporação de texto multilíngue e classificação de relevância. A série, que inclui modelos projetados para incorporação de texto, recuperação e tarefas de reclassificação, suporta 119 idiomas e está disponível nas versões 0,6B, 4B e 8B.

As séries Qwen3-Embedding e Qwen3-Reranker são construídas sobre o modelo base Qwen3, que possui robustas capacidades de compreensão de texto multilíngue. Esses novos modelos alcançaram desempenho de ponta em vários benchmarks para tarefas de incorporação e reclassificação de texto. Eles são disponibilizados como código aberto sob a licença Apache 2.0 no Hugging Face, GitHub e ModelScope, e podem ser utilizados via API na Alibaba Cloud.

A série Qwen3-Embedding oferece uma variedade de tamanhos para modelos de incorporação e reclassificação, atendendo a diversos casos de uso que priorizam eficiência e eficácia. O modelo de incorporação de tamanho 8B ocupa o primeiro lugar no ranking multilíngue MTEB desde 5 de junho de 2025, com uma pontuação de 70,58. Os modelos de reclassificação se destacam em cenários de recuperação de texto, melhorando significativamente a relevância das buscas.

A série Qwen3-Embedding suporta mais de 100 idiomas, incluindo várias linguagens de programação, e fornece recursos robustos de recuperação multilíngue, entre idiomas e de código. Os modelos são projetados usando arquiteturas de codificador duplo e codificador cruzado, visando preservar e aprimorar completamente as capacidades de compreensão de texto do modelo base.

A estrutura de treinamento da série Qwen3-Embedding segue o paradigma de treinamento em múltiplos estágios estabelecido pela série GTE-Qwen. Isso inclui uma estrutura de treinamento em três estágios para o modelo de Embedding e o uso direto de dados rotulados de alta qualidade para o treinamento supervisionado do modelo de Reranking, melhorando a eficiência do treinamento.

Como parte do trabalho futuro, a Alibaba planeja otimizar ainda mais o modelo base Qwen para aumentar a eficiência do treinamento de incorporações de texto e modelos de reclassificação. Isso melhorará o desempenho de implantação em vários cenários. Além disso, a empresa planeja expandir seu sistema de representação multimodal para estabelecer capacidades de compreensão semântica entre diferentes modalidades.

Essa notícia foi traduzida com a ajuda de inteligência artificial. Para mais informação, veja nossos Termos de Uso.

Últimos comentários

Instale nossos aplicativos
Divulgação de riscos: Negociar instrumentos financeiros e/ou criptomoedas envolve riscos elevados, inclusive o risco de perder parte ou todo o valor do investimento, e pode não ser algo indicado e apropriado a todos os investidores. Os preços das criptomoedas são extremamente voláteis e podem ser afetados por fatores externos, como eventos financeiros, regulatórios ou políticos. Negociar com margem aumenta os riscos financeiros.
Antes de decidir operar e negociar instrumentos financeiros ou criptomoedas, você deve se informar completamente sobre os riscos e custos associados a operações e negociações nos mercados financeiros, considerar cuidadosamente seus objetivos de investimento, nível de experiência e apetite de risco; além disso, recomenda-se procurar orientação e conselhos profissionais quando necessário.
A Fusion Media gostaria de lembrar que os dados contidos nesse site não são necessariamente precisos ou atualizados em tempo real. Os dados e preços disponíveis no site não são necessariamente fornecidos por qualquer mercado ou bolsa de valores, mas sim por market makers e, por isso, os preços podem não ser exatos e podem diferir dos preços reais em qualquer mercado, o que significa que são inapropriados para fins de uso em negociações e operações financeiras. A Fusion Media e quaisquer outros colaboradores/partes fornecedoras de conteúdo não são responsáveis por quaisquer perdas e danos financeiros ou em negociações sofridas como resultado da utilização das informações contidas nesse site.
É proibido utilizar, armazenar, reproduzir, exibir, modificar, transmitir ou distribuir os dados contidos nesse site sem permissão explícita prévia por escrito da Fusion Media e/ou de colaboradores/partes fornecedoras de conteúdo. Todos os direitos de propriedade intelectual são reservados aos colaboradores/partes fornecedoras de conteúdo e/ou bolsas de valores que fornecem os dados contidos nesse site.
A Fusion Media pode ser compensada pelos anunciantes que aparecem no site com base na interação dos usuários do site com os anúncios publicitários ou entidades anunciantes.
A versão em inglês deste acordo é a versão principal, a qual prevalece sempre que houver alguma discrepância entre a versão em inglês e a versão em português.
© 2007-2025 - Fusion Media Limited. Todos os direitos reservados.