A Anthropic apresentou uma versão aprimorada de seu modelo de linguagem chamado Claude Instant 1.2, especialmente desenvolvido para aplicações empresariais.
Através de uma API, o modelo oferece um equilíbrio entre velocidade e custo-efetividade, incorporando recursos do modelo principal recentemente atualizado da Anthropic, o Claude 2. Isso resultou em melhorias notáveis em matemática, programação, raciocínio e outras tarefas, como conversas informais, análise de texto, resumos e compreensão de documentos. Além disso, o modelo apresenta maior resistência a tentativas de invasão.
O novo modelo obteve uma pontuação de 58,7% no benchmark Codex P@1 para programação Python, um aumento em relação aos 52,8% do modelo anterior.
Além disso, teve um desempenho melhor no benchmark de problemas matemáticos de nível fundamental GSM8k, alcançando uma pontuação de 86,7%, um aumento significativo em relação aos 80,9% da versão anterior. A nova versão gera respostas mais longas e estruturadas, com melhor aderência às instruções de formatação. Outras melhorias incluem extração de citações superior, suporte multilíngue e respostas a perguntas. O Claude Instant 1.2 também reduz a ocorrência de “alucinações” ou geração de texto incorreto ou sem sentido.
Apesar de algumas pequenas diminuições em alguns benchmarks em comparação com a versão anterior, as melhorias gerais do Claude Instant 1.2 são substanciais. Diferentemente do Claude 2, que os usuários podem utilizar diretamente no site da Anthropic, o Claude Instant 1.2 é exclusivamente acessível a empresas por meio de uma API.
No entanto, serviços de terceiros, como o Poe do Quora, o DuckAssist do DuckDuckGo ou o Notion AI Assistant, fornecem acesso ao Claude Instant 1.2 e outros modelos de linguagem em alguns casos, como o novo Llama 2 da Meta.