Este artigo apresenta estudo baseado em técnicas de processamento de linguagem natural para vinculação de processos judiciais a temas repetitivos. O estudo utiliza a análise semântica latente, a partir da aplicação da matriz termo-documento em seis temas candidatos a se tornarem incidentes de resolução de demanda repetitiva. Em um conjunto de 225.080 petições iniciais digitais, foram encontrados 8.706 processos com score significativo de similaridade a um dos thesaurus criados para cada tema. O resultado do estudo indica que essa técnica pode ser aplicada com sucesso em processos judiciais eletrônicos e tem o potencial de melhorar significativamente a produtividade do Judiciário.
This article presents a study on the linking of lawsuits to repetitive thematic based on natural language processing techniques. The study uses latent semantic analysis through the employment of a term-document matrix in six themes candidates to being formalized into an expedient of repetitive case. In a population 225,080 digital initial petition, 8,706 were found to have statistically matched the similarity of the thesaurus of one of the six themes. The result indicates that this technique can be successfully applied in digital lawsuits and has the potential to significantly improve the productivity of the justice system.