Dólar se reaproxima dos R$5,60 impulsionado pelo exterior após acordo entre EUA e UE
A Alibaba (NYSE:BABA) lançou a série Qwen3-Embedding e Qwen3-Reranker, estabelecendo novos padrões em incorporação de texto multilíngue e classificação de relevância. A série, que inclui modelos projetados para incorporação de texto, recuperação e tarefas de reclassificação, suporta 119 idiomas e está disponível nas versões 0,6B, 4B e 8B.
As séries Qwen3-Embedding e Qwen3-Reranker são construídas sobre o modelo base Qwen3, que possui robustas capacidades de compreensão de texto multilíngue. Esses novos modelos alcançaram desempenho de ponta em vários benchmarks para tarefas de incorporação e reclassificação de texto. Eles são disponibilizados como código aberto sob a licença Apache 2.0 no Hugging Face, GitHub e ModelScope, e podem ser utilizados via API na Alibaba Cloud.
A série Qwen3-Embedding oferece uma variedade de tamanhos para modelos de incorporação e reclassificação, atendendo a diversos casos de uso que priorizam eficiência e eficácia. O modelo de incorporação de tamanho 8B ocupa o primeiro lugar no ranking multilíngue MTEB desde 5 de junho de 2025, com uma pontuação de 70,58. Os modelos de reclassificação se destacam em cenários de recuperação de texto, melhorando significativamente a relevância das buscas.
A série Qwen3-Embedding suporta mais de 100 idiomas, incluindo várias linguagens de programação, e fornece recursos robustos de recuperação multilíngue, entre idiomas e de código. Os modelos são projetados usando arquiteturas de codificador duplo e codificador cruzado, visando preservar e aprimorar completamente as capacidades de compreensão de texto do modelo base.
A estrutura de treinamento da série Qwen3-Embedding segue o paradigma de treinamento em múltiplos estágios estabelecido pela série GTE-Qwen. Isso inclui uma estrutura de treinamento em três estágios para o modelo de Embedding e o uso direto de dados rotulados de alta qualidade para o treinamento supervisionado do modelo de Reranking, melhorando a eficiência do treinamento.
Como parte do trabalho futuro, a Alibaba planeja otimizar ainda mais o modelo base Qwen para aumentar a eficiência do treinamento de incorporações de texto e modelos de reclassificação. Isso melhorará o desempenho de implantação em vários cenários. Além disso, a empresa planeja expandir seu sistema de representação multimodal para estabelecer capacidades de compreensão semântica entre diferentes modalidades.
Essa notícia foi traduzida com a ajuda de inteligência artificial. Para mais informação, veja nossos Termos de Uso.