Calendário Econômico: Inflação no Brasil, EUA dá tom em semana de balanços na B3
Por Anna Tong e Greg Bensinger
SAN FRANCISCO (Reuters) - A OpenAI informou nesta terça-feira que lançou dois modelos de linguagem de peso aberto otimizados para rodar em notebooks e que se destacam em raciocínio avançado, com níveis de desempenho semelhantes aos de seus modelos proprietários menores.
Um modelo de linguagem de peso aberto tem seus parâmetros treinados ou pesos acessíveis ao público, permitindo que desenvolvedores analisem e ajustem o modelo para tarefas específicas sem precisar dos dados originais de treinamento.
"Algo único dos modelos abertos é que as pessoas podem executá-los localmente. As pessoas podem rodá-los por trás de seu próprio firewall, em sua própria infraestrutura", disse o cofundador da OpenAI, Greg Brockman, em coletiva de imprensa.
Os modelos de linguagem de peso aberto são diferentes dos modelos de código aberto, que oferecem acesso ao código-fonte completo, dados de treinamento e metodologias.
Em paralelo, a Amazon (NASDAQ:AMZN) anunciou que os modelos de peso aberto da OpenAI agora estão disponíveis em seu marketplace de IA generativa Bedrock, do Amazon Web Services. É a primeira vez que um modelo da OpenAI é oferecido no Bedrock, de acordo com o diretor de produtos da Bedrock, Atul Deo.
"A OpenAI vem desenvolvendo ótimos modelos e acreditamos que esses modelos serão ótimas opções de código aberto, ou opções de modelos de peso aberto para os clientes", disse Deo. Ele não quis comentar quaisquer acordos contratuais entre AWS e OpenAI.
Os dois novos modelos da OpenAI são os primeiros modelos abertos lançados pela OpenAI desde o GPT-2, lançado em 2019.
O modelo maior da OpenAI, gpt-oss-120b, pode rodar em uma única GPU, enquanto o segundo, gpt-oss-20b, é pequeno o suficiente para rodar diretamente em um computador pessoal, segundo a empresa.
A OpenAI disse que os modelos têm desempenho semelhante aos seus modelos proprietários de raciocínio chamados o3-mini e o4-mini, e se destacam especialmente em tarefas de programação, matemática de competições e consultas relacionadas à saúde.
(Reportagem de Anna Tong e Greg Bensinger em San Francisco)