A Databricks, empresa de software que se estabeleceu em vários setores, incluindo armazenamento de dados e soluções baseadas em IA, lançou seu modelo de linguagem de grande escala (LLM) de código aberto, chamado ‘Dolly’.
O modelo, com apenas 6 bilhões de parâmetros, utiliza um modelo de parâmetro de código aberto existente da EleutherAI e foi ajustado para dar a Dolly capacidades de geração de texto e brainstorming.
Embora possa parecer pequeno em comparação com os 175 bilhões de parâmetros do GPT-3, os criadores da Dolly ficaram surpresos ao ver que, mesmo com essa quantidade menor de dados, ela foi capaz de exibir muitas das mesmas capacidades do ChatGPT.
A Databricks decidiu disponibilizar seu modelo de linguagem de código aberto para que empresas possam construir seu próprio modelo, em vez de enviar seus dados para provedores centralizados que bloqueiam o modelo por trás de uma API.
No entanto, para usar a Dolly, os usuários precisam usar a plataforma da Databricks e entrar em contato com eles para obter acesso aos pesos treinados.
Embora isso possa não ser a solução para todas as empresas, a iniciativa da Databricks certamente deve ajudar as empresas a salvaguardar seus dados, economizar custos operacionais e permitir que elas criem seu próprio modelo.