A utilização de visão computacional desempenha um papel importante para fins de segurança. Porém, a combinação com técnicas de aprendizado profundo e redes neurais convolucionais ainda são pouco exploradas por demandarem bastante capacidade de processamento computacional. Este trabalho tem por objetivo combinar essas técnicas com o objetivo de gerar um algoritmo que seja capaz de identificar e rastrear indivíduos em vídeos, além disso, monitorar suas ações com o propósito de identificar movimentos que possam significar um ato criminoso, utilizando o algoritmo do YOLO para a identificação, filtro de Kalman para o rastreamento e BlazePose para a identificação dos movimentos.Como resultado foi obtido uma taxa de precisão de 95% em vídeos bem definidos e uma taxa de 81% de precisão utilizando vídeos de câmeras de segurança mais populares.
The use of computer vision plays an important role for security purposes. However, the combination with deep learning techniques and convolutional neural networks are still little explored because they demand a lot of computational processing capacity. This work aims to combine these techniques in order to generate an algorithm that is capable of identifying and tracking individuals in videos, in addition to monitoring their actions with the purpose of identifying movements that could signify a criminal act, using the YOLO algorithm for identification, Kalman filter for tracking and BlazePose for movement identification.This work resulted in a 95% accuracy rate on well-defined videos and an 81% accuracy rate using video from the most popular security cameras.