ANÁLISE DE UMA METODOLOGIA PARA PREENCHIMENTO DE VALORES FALTANTES EM DADOS DE PRECIPITAÇÃO, PARA O ESTADO DO PARANÁ

Unopar Científica Ciências Exatas e Tecnológicas

Endereço:
Rua Marselha, nº 591 Jardim Piza
Londrina / PR
86041-120
Site: http://www.unopar.br
Telefone: (43) 3371-7931
ISSN: 1679-088X
Editor Chefe: Hélio Hiroshi Suguimoto
Início Publicação: 31/10/2012
Periodicidade: Anual
Área de Estudo: Ciência da computação

ANÁLISE DE UMA METODOLOGIA PARA PREENCHIMENTO DE VALORES FALTANTES EM DADOS DE PRECIPITAÇÃO, PARA O ESTADO DO PARANÁ

Ano: 2012 | Volume: 11 | Número: 1
Autores: R. A. Moraes, C. L. Arraes
Autor Correspondente: R. A. Moraes | [email protected]

Palavras-chave: Chuva. Dados Faltantes. Cluster. Mineração de Dados

Resumos Cadastrados

Resumo Português:

A disponibilidade de dados meteorológicos para dada região segue como essencial para estudos climáticos, agrícolas, dentre outros. Porém, devido a problemas de medição nas estações meteorológicas, estes dados nem sempre estão disponíveis ao longo do tempo, criando muitos valores faltantes e falhos. Uma vez que a aplicação de metodologias de substituição de valores faltantes em regiões homogêneas espacialmente pode ser mais viável do que utilizar toda a base de dados de forma heterogênea,, avaliou-se uma metodologia para preenchimentos de valores faltantes para o Estado do Paraná, a partir de dados decendiais de precipitação do modelo global ECMWF, para o ano de 2008. Foram criados dois grupos, um que considerasse toda a base de dados e outro que aplicasse a técnica k-means para separação dos dados em clusters. Destes, foram omitidos 1% dos dados e substituídos através das técnicas de kNN, Regressão e Redes Neurais utilizando o software Weka. Verificou-se que ao substituir os valores faltantes no grupo, considerando toda base de dados e o grupo dos clusters, não houve diferença significativa (com R² maior que 0,90). Assim, nas condições estabelecidas de 1% de dados faltantes, a aplicação desta metodologia não é necessária para o Estado do Paraná.



Resumo Inglês:

The availability of meteorological data for a given region is essential for climate and agriculture studies. However, these data are not always available over time due to measurement problems in weather stations, which leads to produce missing and failed values. Once certain methodologies applied for the replacement of missing values in spatially homogeneous regions is better than using the full database in a heterogeneous manner, we evaluated a methodology for replacing missing data values of dekadal precipitation from ECMWF global model in Parana state for the year 2008. We created two groups, one considering all database and other applying the k-means technique to create clusters. Of these, 1% was omitted from the data base and then replaced by techniques of kNN, Regression and Neural Networks using the Weka software. It was found that replacing missing values and considering the whole database and only clusters, there was no significant difference (R² greater than 0.90), so the use of this methodology is not necessary for the Parana state.