A Inteligência Artificial (IA) tem sido usada em diferentes áreas, incluindo a indústria criativa. Pesquisadores das universidades italianas de Florença, Módena e Reggio Emilia e Pisa desenvolveram um novo marco de visão computacional para ajudar designers de moda a visualizar seus projetos em corpos humanos. Com um enfoque chamado “edição de imagens de moda multimodal condicionada”, os designers podem gerar imagens de moda a partir de diferentes estímulos, como texto, esboços e pontos-chave do corpo humano.
Os pesquisadores optaram por criar um modelo baseado em modelos de difusão latente (LDM), em vez de usar redes adversárias generativas (GAN) que são frequentemente utilizadas para gerar imagens. Os modelos LDM são treinados em um espaço latente comprimido e de menor dimensão, o que permite criar imagens sintéticas de alta qualidade. No entanto, para treinar o modelo, os pesquisadores tiveram que atualizar os conjuntos de dados existentes ou criar novos, já que a maioria dos conjuntos de dados existentes só inclui imagens de baixa resolução de roupas.
Os resultados experimentais do modelo foram promissores, criando imagens realistas de roupas em corpos humanos com base em estímulos de texto e esboços. O código-fonte do modelo e as anotações multimodais adicionadas aos conjuntos de dados já estão disponíveis no GitHub. O modelo pode ser integrado em ferramentas de software existentes ou novas para designers de moda e pode informar o desenvolvimento de outras arquiteturas de IA para aplicativos criativos do mundo real. O uso da IA pode ajudar a automatizar processos tediosos e inspirar designers, facilitando seu processo criativo.