Databricks lança seu próprio modelo de linguagem com código aberto

Será que é tão poderoso quanto o ChatGPT?

Databricks lança seu próprio modelo de linguagem com código aberto
Photo by Alex Knight / Unsplash

A Databricks, empresa de software que se estabeleceu em vários setores, incluindo armazenamento de dados e soluções baseadas em IA, lançou seu modelo de linguagem de grande escala (LLM) de código aberto, chamado 'Dolly'.

O modelo, com apenas 6 bilhões de parâmetros, utiliza um modelo de parâmetro de código aberto existente da EleutherAI e foi ajustado para dar a Dolly capacidades de geração de texto e brainstorming.

Embora possa parecer pequeno em comparação com os 175 bilhões de parâmetros do GPT-3, os criadores da Dolly ficaram surpresos ao ver que, mesmo com essa quantidade menor de dados, ela foi capaz de exibir muitas das mesmas capacidades do ChatGPT.

A Databricks decidiu disponibilizar seu modelo de linguagem de código aberto para que empresas possam construir seu próprio modelo, em vez de enviar seus dados para provedores centralizados que bloqueiam o modelo por trás de uma API.

No entanto, para usar a Dolly, os usuários precisam usar a plataforma da Databricks e entrar em contato com eles para obter acesso aos pesos treinados.

Embora isso possa não ser a solução para todas as empresas, a iniciativa da Databricks certamente deve ajudar as empresas a salvaguardar seus dados, economizar custos operacionais e permitir que elas criem seu próprio modelo.

Novidad.es no Google News

Adicione o Novidad.es em seu feed do Google News.

Mastodon