Por Jane Lanhee Lee
OAKLAND, Califórnia (Reuters) - A startup de chips de inteligência artificial Cerebras Systems anunciou nesta terça-feira que lançou modelos de código aberto semelhantes ao ChatGPT para a comunidade de pesquisa e negócios usar gratuitamente, em um esforço para promover maiores colaborações.
A Cerebras lançou sete modelos, todos treinados em seu supercomputador de inteligência artificial chamado Andromeda, incluindo modelos menores de 111 milhões de parâmetros de linguagem para um modelo maior de 13 bilhões de parâmetros.
Os modelos com mais parâmetros são capazes de realizar funções generativas mais complexas.
O chatbot ChatGPT, lançado no final do ano passado pela OpenAI, por exemplo, tem 175 bilhões de parâmetros e pode produzir poesia e pesquisa, o que ajudou a atrair grande interesse e financiamento para o setor de forma mais ampla.
A Cerebras disse que os modelos menores podem ser implantados em telefones ou caixas de sim inteligentes, enquanto os maiores rodam em PCs ou servidores, embora tarefas complexas exijam modelos maiores.
Karl Freund, consultor de chips da Cambrian AI, disse que maior nem sempre é melhor.
“Existem alguns artigos interessantes publicados que mostram que (um modelo menor) pode ser preciso se você o treinar mais”, disse Freund. "Portanto, há uma troca entre maiores e melhores treinados."
Andrew Feldman, fundador e presidente-executivo da Cerebras, disse que seu maior modelo levou pouco mais de uma semana para treinar, trabalho que normalmente pode levar vários meses, graças à arquitetura do sistema Cerebras, que inclui um chip do tamanho de um prato construído para treinamento de inteligência artificial.
A maioria dos modelos é treinada em chips da NVIDIA (NASDAQ:NVDA), mas cada vez mais startups como a Cerebras estão tentando ganhar participação nesse mercado.
Os modelos treinados em máquinas da empresa também podem ser usados em sistemas Nvidia para treinamento ou customização, disse Feldman.