A Meta Platforms (NASDAQ:META) lançou a versão mais extensa de seus modelos de inteligência artificial Llama 3, apresentando aprimoramentos nos recursos de linguagem e resolução de problemas matemáticos. A empresa anunciou o lançamento do novo modelo de IA, que pode se comunicar em oito idiomas diferentes, produzir código de computador de alta qualidade e resolver problemas matemáticos mais complexos do que seus antecessores.
O modelo Llama 3, com seus 405 bilhões de parâmetros, representa um avanço significativo em relação à última iteração e faz parte do esforço da Meta contra modelos rivais pagos, como o GPT-4 da OpenAI, que possui um trilhão de parâmetros, e um próximo modelo da Amazon com dois trilhões de parâmetros.
Em um movimento estratégico, a Meta está oferecendo os modelos Llama 3 em grande parte gratuitamente para desenvolvedores, o que o CEO Mark Zuckerberg acredita que promoverá a inovação e reduzirá a dependência dos concorrentes. A adoção generalizada do chatbot de IA alimentado por esses modelos é antecipada, com Zuckerberg prevendo que ele se tornará o assistente de IA mais popular até o final do ano, já em uso por centenas de milhões.
O lançamento destaca a corrida da indústria de tecnologia para demonstrar o valor de grandes modelos de linguagem na abordagem de desafios complexos de raciocínio. O principal cientista de IA da Meta sugeriu que, embora esses modelos estejam alcançando novos patamares, sistemas alternativos de IA podem ser necessários para avanços futuros.
Além do modelo principal, a Meta também está atualizando suas versões mais leves de 8 bilhões e 70 bilhões de parâmetros. Esses modelos agora apresentam uma "janela de contexto" expandida, permitindo que eles lidem com solicitações maiores do usuário e lembrem-se de mais informações, o que é particularmente benéfico para gerar código de computador.
Ahmad Al-Dahle, chefe de IA generativa da Meta, observou a importância da janela de contexto maior, pois foi o principal feedback da comunidade de desenvolvedores. Sua equipe também melhorou a capacidade do modelo Llama 3 de resolver problemas matemáticos usando dados gerados por IA para treinamento.
Apesar dos custos envolvidos, que atraíram algum escrutínio dos investidores, a estratégia da Meta pode atrapalhar os modelos de negócios de seus concorrentes se os desenvolvedores preferirem seus modelos gratuitos. A empresa se gabou do desempenho do Llama 3 em benchmarks, com pontuações que rivalizam ou excedem as de modelos líderes como GPT-4o e Claude 3.5 Sonnet em testes de matemática e conhecimento.
O modelo Llama 3 marcou 73,8 no benchmark MATH, seguindo de perto os 76,6 do GPT-4o e à frente dos 71,1 do Claude 3.5 Sonnet. Ele também alcançou 88,6 no benchmark MMLU, que abrange vários assuntos, quase igualando os 88,7 do GPT-4o e superando ligeiramente os 88,3 do Claude 3.5 Sonnet.
Olhando para o futuro, os pesquisadores da Meta estão provocando o desenvolvimento de versões "multimodais" dos modelos, que integrarão recursos de imagem, vídeo e fala junto com as principais funções de texto. Espera-se que eles tenham um desempenho competitivo com outros modelos multimodais, como o Gemini 1.5 do Google e o Claude 3.5 Sonnet da Anthropic, e estão programados para serem lançados ainda este ano.
A Reuters contribuiu para este artigo.Essa notícia foi traduzida com a ajuda de inteligência artificial. Para mais informação, veja nossos Termos de Uso.