Meta apresenta DINOv3, um avanço na IA de visão com aprendizado autossupervisionado

Publicado 14.08.2025, 13:32
© Reuters.

Investing.com -- A Meta revelou o DINOv3, um modelo de visão computacional de última geração que alcança desempenho sem precedentes em diversas tarefas visuais sem necessidade de dados rotulados.

O novo modelo escala o aprendizado autossupervisionado para criar backbones de visão universais que superam soluções especializadas em múltiplas tarefas, incluindo detecção de objetos e segmentação semântica. O DINOv3 foi treinado com 1,7 bilhão de imagens e escalado para 7 bilhões de parâmetros, representando um modelo 7 vezes maior em um conjunto de dados 12 vezes maior que seu antecessor.

Diferentemente das abordagens anteriores que dependem fortemente de metadados gerados por humanos, como legendas da web, o DINOv3 aprende de forma independente, sem supervisão humana. Essa abordagem sem rótulos permite aplicações onde anotações são escassas, caras ou impossíveis de obter.

O modelo produz recursos visuais de alta resolução que facilitam o treinamento de adaptadores leves, resultando em desempenho excepcional em classificação de imagens, segmentação semântica e rastreamento de objetos em vídeo. Pela primeira vez, um único backbone de visão congelado supera soluções especializadas em múltiplas tarefas de predição densa.

A Meta está lançando um conjunto abrangente de backbones pré-treinados sob licença comercial, incluindo modelos menores que superam derivados comparáveis baseados em CLIP e arquiteturas ConvNeXt alternativas para casos de uso com recursos limitados. A empresa também está compartilhando cabeçalhos de avaliação downstream e notebooks de exemplo para ajudar desenvolvedores a construir com o DINOv3.

Aplicações do mundo real já estão surgindo. O Instituto de Recursos Mundiais está usando o DINOv3 para monitorar o desmatamento e apoiar esforços de restauração. Em comparação com o DINOv2, o novo modelo reduz o erro médio na medição da altura do dossel das árvores em uma região do Quênia de 4,1 metros para 1,2 metros.

O Laboratório de Propulsão a Jato da NASA também está aproveitando a tecnologia para construir robôs de exploração para Marte, permitindo múltiplas tarefas de visão com requisitos mínimos de computação.

O lançamento inclui o código completo de treinamento do DINOv3 e modelos pré-treinados para impulsionar a inovação em visão computacional e aplicações multimodais em diversos setores, incluindo saúde, monitoramento ambiental, veículos autônomos, varejo e manufatura.

Essa notícia foi traduzida com a ajuda de inteligência artificial. Para mais informação, veja nossos Termos de Uso.

Últimos comentários

Instale nossos aplicativos
Divulgação de riscos: Negociar instrumentos financeiros e/ou criptomoedas envolve riscos elevados, inclusive o risco de perder parte ou todo o valor do investimento, e pode não ser algo indicado e apropriado a todos os investidores. Os preços das criptomoedas são extremamente voláteis e podem ser afetados por fatores externos, como eventos financeiros, regulatórios ou políticos. Negociar com margem aumenta os riscos financeiros.
Antes de decidir operar e negociar instrumentos financeiros ou criptomoedas, você deve se informar completamente sobre os riscos e custos associados a operações e negociações nos mercados financeiros, considerar cuidadosamente seus objetivos de investimento, nível de experiência e apetite de risco; além disso, recomenda-se procurar orientação e conselhos profissionais quando necessário.
A Fusion Media gostaria de lembrar que os dados contidos nesse site não são necessariamente precisos ou atualizados em tempo real. Os dados e preços disponíveis no site não são necessariamente fornecidos por qualquer mercado ou bolsa de valores, mas sim por market makers e, por isso, os preços podem não ser exatos e podem diferir dos preços reais em qualquer mercado, o que significa que são inapropriados para fins de uso em negociações e operações financeiras. A Fusion Media e quaisquer outros colaboradores/partes fornecedoras de conteúdo não são responsáveis por quaisquer perdas e danos financeiros ou em negociações sofridas como resultado da utilização das informações contidas nesse site.
É proibido utilizar, armazenar, reproduzir, exibir, modificar, transmitir ou distribuir os dados contidos nesse site sem permissão explícita prévia por escrito da Fusion Media e/ou de colaboradores/partes fornecedoras de conteúdo. Todos os direitos de propriedade intelectual são reservados aos colaboradores/partes fornecedoras de conteúdo e/ou bolsas de valores que fornecem os dados contidos nesse site.
A Fusion Media pode ser compensada pelos anunciantes que aparecem no site com base na interação dos usuários do site com os anúncios publicitários ou entidades anunciantes.
A versão em inglês deste acordo é a versão principal, a qual prevalece sempre que houver alguma discrepância entre a versão em inglês e a versão em português.
© 2007-2025 - Fusion Media Limited. Todos os direitos reservados.