MANIPULAÇÃO DE DADOS PARA MODELAGEM EM APRENDIZADO DE MÁQUINA

SOUZAEAD REVISTA ACADÊMICA DIGITAL

Endereço:
Avenida Santa Helena,1140 - Novo Cruzeiro
Ipatinga / MG
35164332
Site: https://souzaeadrevistaacademica.com.br/
Telefone: (31) 8908-9153
ISSN: 2595-5934
Editor Chefe: Profº Dr. André Ribeiro da Silva
Início Publicação: 27/08/2018
Periodicidade: Mensal
Área de Estudo: Ciências Agrárias, Área de Estudo: Ciências Biológicas, Área de Estudo: Ciências da Saúde, Área de Estudo: Ciências Exatas, Área de Estudo: Ciências Humanas, Área de Estudo: Ciências Sociais Aplicadas, Área de Estudo: Engenharias, Área de Estudo: Linguística, Letras e Artes, Área de Estudo: Multidisciplinar

MANIPULAÇÃO DE DADOS PARA MODELAGEM EM APRENDIZADO DE MÁQUINA

Ano: 2024 | Volume: 80 | Número: 80
Autores: LOUREIRO. Arthur Afonso Bitencourt, PEREIRA. Gabriella Gomes
Autor Correspondente: LOUREIRO. Arthur Afonso Bitencourt | [email protected]

Palavras-chave: aprendizado de máquina, divisão de amostras, preparação de dados

Resumos Cadastrados

Resumo Português:

A preparação de dados é vital na aplicação de algoritmos de aprendizado de máquina, garantindo a integridade e coesão dos dados para otimizar o desempenho e obter resultados positivos. Esta etapa é fundamental na criação de modelos de Aprendizado de Máquina, pois os dados são a base de qualquer classificador. Este estudo teve como objetivo o pré-processamento, que inclui a limpeza e remoção de dados irrelevantes, a identificação e correção de erros, o tratamento de valores ausentes e a eliminação de informações desnecessárias, assegurando a qualidade dos dados utilizados nas análises. O processo de manipulação e preparação envolveu a integração de dados de várias fontes, a transformação dos dados para formatos adequados, como normalização ou codificação de variáveis, e a redução da dimensionalidade do conjunto de dados para simplificar a análise e melhorar o desempenho dos algoritmos. A etapa subsequente consistiu na divisão da amostra em conjuntos de treinamento e teste que permite avaliar a capacidade do modelo não apenas com os dados de ajuste, mas também sua habilidade de generalização para novas observações. Uma maior disponibilidade de observações geralmente implica proporções mais elevadas para o conjunto de treinamento, garantindo uma representatividade adequada dos dados no processo de ajuste. Em conclusão, a preparação de dados é fundamental para a qualidade e eficácia das análises em abordagens de aprendizado de máquina, fornecendo uma base sólida para a construção de modelos preditivos.