Alibaba lança Qwen-Image, modelo de imagem de 20B com renderização avançada de texto

Publicado 04.08.2025, 13:09
© Reuters.

A Alibaba (NYSE:BABA) lançou o Qwen-Image, um modelo de fundação de imagem MMDiT de 20B que oferece avanços significativos em renderização complexa de texto e recursos precisos de edição de imagem.

O novo modelo, que os usuários podem acessar através do Qwen Chat selecionando "Geração de Imagem", apresenta capacidades superiores de renderização de texto que lidam com layouts de múltiplas linhas, semântica em nível de parágrafo e detalhes minuciosos. Ele suporta tanto idiomas alfabéticos como o inglês quanto idiomas logográficos como o chinês com alta fidelidade.

O Qwen-Image também oferece edição de imagem consistente através de um paradigma aprimorado de treinamento multitarefa, alcançando desempenho excepcional na preservação tanto do significado semântico quanto do realismo visual durante operações de edição.

De acordo com a Alibaba, o modelo supera as soluções existentes em vários benchmarks públicos para tarefas de geração e edição, incluindo GenEval, DPG, OneIG-Bench, GEdit, ImgEdit e GSO. Ele se destaca particularmente em benchmarks de renderização de texto como LongText-Bench, ChineseWord e TextCraft, onde supera significativamente os modelos de última geração atuais.

A empresa demonstrou as capacidades do Qwen-Image através de vários exemplos, mostrando sua habilidade de renderizar texto complexo em diferentes cenários. Estes incluem a geração precisa de caracteres chineses em placas de lojas com profundidade de campo adequada, criação de texto detalhado em inglês em capas de livros e slides informativos, além de lidar facilmente com conteúdo bilíngue.

Além do processamento de texto, o Qwen-Image suporta uma ampla gama de estilos artísticos, desde cenas fotorrealistas até pinturas impressionistas, e oferece várias operações de edição, incluindo transferência de estilo, adições, exclusões, aprimoramento de detalhes, edição de texto e ajuste de pose de personagens.

A Alibaba afirmou que o Qwen-Image visa promover o desenvolvimento da geração de imagens, reduzir barreiras técnicas para a criação de conteúdo visual e inspirar aplicações inovadoras. A empresa está convidando a participação e feedback da comunidade para construir "um ecossistema de IA generativa aberto, transparente e sustentável".

O lançamento do modelo está programado para agosto de 2025.

Essa notícia foi traduzida com a ajuda de inteligência artificial. Para mais informação, veja nossos Termos de Uso.

Últimos comentários

Instale nossos aplicativos
Divulgação de riscos: Negociar instrumentos financeiros e/ou criptomoedas envolve riscos elevados, inclusive o risco de perder parte ou todo o valor do investimento, e pode não ser algo indicado e apropriado a todos os investidores. Os preços das criptomoedas são extremamente voláteis e podem ser afetados por fatores externos, como eventos financeiros, regulatórios ou políticos. Negociar com margem aumenta os riscos financeiros.
Antes de decidir operar e negociar instrumentos financeiros ou criptomoedas, você deve se informar completamente sobre os riscos e custos associados a operações e negociações nos mercados financeiros, considerar cuidadosamente seus objetivos de investimento, nível de experiência e apetite de risco; além disso, recomenda-se procurar orientação e conselhos profissionais quando necessário.
A Fusion Media gostaria de lembrar que os dados contidos nesse site não são necessariamente precisos ou atualizados em tempo real. Os dados e preços disponíveis no site não são necessariamente fornecidos por qualquer mercado ou bolsa de valores, mas sim por market makers e, por isso, os preços podem não ser exatos e podem diferir dos preços reais em qualquer mercado, o que significa que são inapropriados para fins de uso em negociações e operações financeiras. A Fusion Media e quaisquer outros colaboradores/partes fornecedoras de conteúdo não são responsáveis por quaisquer perdas e danos financeiros ou em negociações sofridas como resultado da utilização das informações contidas nesse site.
É proibido utilizar, armazenar, reproduzir, exibir, modificar, transmitir ou distribuir os dados contidos nesse site sem permissão explícita prévia por escrito da Fusion Media e/ou de colaboradores/partes fornecedoras de conteúdo. Todos os direitos de propriedade intelectual são reservados aos colaboradores/partes fornecedoras de conteúdo e/ou bolsas de valores que fornecem os dados contidos nesse site.
A Fusion Media pode ser compensada pelos anunciantes que aparecem no site com base na interação dos usuários do site com os anúncios publicitários ou entidades anunciantes.
A versão em inglês deste acordo é a versão principal, a qual prevalece sempre que houver alguma discrepância entre a versão em inglês e a versão em português.
© 2007-2025 - Fusion Media Limited. Todos os direitos reservados.