Aplicando redes neurais para reduzir espaço utilizado no armazenamento de conjuntos de dados

Revista Terra & Cultura

Endereço:
Rua Alagoas, 2050 - Centro
Londrina / PR
86020430
Site: http://periodicos.unifil.br/index.php/Revistateste/index
Telefone: (43) 3375-7448
ISSN: 0104-8112
Editor Chefe: Leandro Henrique Magalhães
Início Publicação: 01/09/1981
Periodicidade: Semestral
Área de Estudo: Multidisciplinar

Aplicando redes neurais para reduzir espaço utilizado no armazenamento de conjuntos de dados

Ano: 2024 | Volume: 40 | Número: Especial
Autores: Rafael Martins Trindade, Ricardo Petri Silva
Autor Correspondente: Rafael Martins Trindade | [email protected]

Palavras-chave: aprendizagem de máquina, rede neural, redução de dimensionalidade, conjunto de dados, armazenamento de dados.

Resumos Cadastrados

Resumo Português:

Ao  trabalhar  com  Aprendizagem  de  Máquina,  existem  casos  em  que  manipular  o conjunto  de  dados  pode  se  tornar  trabalhoso  ou  demorado  devido  à  grande quantidade   de   informação.   Apesar   de   existirem   técnicas   de   redução   de dimensionalidade   como   a   análise   de   componentes   principais   ou   a   análise discriminante linear que podem ser utilizadas para reduzir a quantidade de atributos, elas não são capazes de reduzir o conjunto de dados sem perda de informação. Esse trabalho  busca  investigar  a  possibilidade  de  empregar  técnicas  que  transformam dados de formas que seriam extremamente difíceis de reverter ao combiná-las com o uso  de  redes  neurais  para  essa  restauração  dos  dados,  sem  que  haja  perda  de informação. Para isso, foi criada uma prova de conceito utilizando a base dedados clássica de flores Iris. Apesar de não terem sido capazes de restaurar o conjunto de dados original, os modelos testados foram capazes de obter valores muito próximos dos  originais.  Por  se  tratar  de  um  estudo  inicial,  houveram  diversas  limitações  nos testes  realizados.  Ainda  que  o  objetivo  proposto  não  tenha  sido  atingido,  ficou evidente que ainda existe potencial inexplorado para este conceito.



Resumo Inglês:

Working  with  Machine  Learning,  there  are  cases  when  manipulating  datasets  can become  cumbersome  or  slow  due  to  the  great  amount  of  data.  Despite  there  being dimensionality  reduction  techniques  such  as  principal  component  analysis  or  linear discriminant  analysis  that  can  be  used  to  reduce  the  amount  of  attributes,  these techniques are not able to reduce the dataset without information loss. This article aims to investigate the possibility of employing techniques which transform data in ways that would be extremely hard to revert by combining them with the use of neural networks for the data restoration, with no information loss. For this purpose, a proof of concept was  made  using  the  iris  dataset.  Although  they  weren't  able  to  restore  the  original datasets, the tested models were able to produce values very close to the originals. Being an initial study, there were many limitations on the tests done. So even though the proposed goal was not reached, it became clear that there's still much unexplored potential for this concept.