A startup de tecnologia de saúde Truveta construiu um modelo de IA para minerar dados de saúde a partir de fontes como notas de médicos e seguradoras de saúde, que são textos desestruturados e repletos de abreviações, jargões e erros de grafia.
O modelo, chamado Truveta Language Model, é capaz de extrair diagnósticos de pacientes, medicamentos, resultados de exames e outros dados com mais de 90% de precisão, de acordo com a empresa.
Ele é treinado em grandes quantidades de dados médicos de 28 parceiros do sistema de saúde da Truveta, representando 16% do atendimento ao paciente nos EUA, e é atualizado diariamente.
Os clientes de saúde e ciências da vida da Truveta usam o modelo para estudar eventos como reações adversas a medicamentos ou a frequência de convulsões em pacientes. Pesquisadores de câncer podem usar a plataforma para detectar a progressão da doença e a necessidade de mudar o tratamento.
O modelo normaliza os dados desestruturados e pode ser usado em escala, já que a Truveta tem acesso a 3,1 bilhões de encontros de pacientes e 2,4 bilhões de pedidos de medicamentos devido às suas relações com grandes sistemas de saúde.
A Truveta é apoiada pela Microsoft e tem colaborado com a empresa em vários esforços, incluindo a introdução de novos clientes à plataforma.
Embora a plataforma da Truveta seja diferente do GPT-4, o grande modelo de linguagem “generativo” da OpenAI apoiada pela Microsoft, que produz instantaneamente conteúdo com base em prompts, as startups estão começando a integrar o GPT-4 às suas ofertas.
A Truveta, por outro lado, comercializa sua plataforma como uma fonte de dados, permitindo que os usuários criem ferramentas gerativas ou extrativas baseadas em seus dados, bem como modelos discriminativos para prever o câncer.
Para Myerson, ex-executivo da Microsoft, a Truveta Language Model é semelhante ao BloombergGPT, um grande modelo de linguagem construído do zero pela empresa de serviços financeiros Bloomberg em março, que foi treinado em grandes quantidades de informações financeiras, semelhante ao modelo da Truveta, que é treinado em grandes quantidades de dados médicos.