O conjunto de dados "Iris de Fisher" tem sido amplamente utilizado na literatura estatística e em numerosos artigos sobre teste e comparação de técnicas de discriminação e classificação multivariada. No entanto, os modelos criados a partir destas técnicas, exigem o cumprimento de determinados supostos que não são satisfeitos por este conjunto de dados. O objetivo deste trabalho é apresentar uma proposta para introduzir os procedimentos de Análise Linear Discriminante e Análise de Agrupamentos usando estes dados clássicos, num curso de análise estatística multivariada exploratória, utilizando o software R, com especial atenção na análise dos supostos necessários, estimativa e interpretação dos modelos obtidos, e validação de resultados.
The "Fisher's Iris" data set has been extensively used in the statistical literature and in numerous articles on testing and comparing multivariate discrimination and classification techniques. The models created from these technique, require the fulfillment of certain assumptions, but these assumptions are not satisfied by this data set. The aim of this work is presenting a proposal to introduce the procedures of Linear Discriminant Analysis and Clusters Analysis using these classic data, in a course of exploratory multivariate analysis, using R software, with special focus on necessary assumptions analysis, the obtained models estimation and interpretation, and the results validation.
El conjunto de datos “Iris de Fisher” ha sido extensamente utilizado en la literatura estadística y en numerosos artículos sobre testeo y comparación de técnicas de discriminación y clasificación multivariadas. Sin embargo, los modelos creados a partir de estas técnicas, requieren el cumplimiento de ciertos supuestos que no son satisfechos por este conjunto de datos. El objetivo de este trabajo es presentar una propuesta para introducir los procedimientos del Análisis Lineal Discriminante y el Análisis de Agrupamientos (Clusters) utilizando estos datos clásicos, en un curso de análisis estadístico multivariado exploratorio, mediante el empleo del software R, con especial atención en el análisis de los supuestos necesarios, la estimación e interpretación de los modelos obtenidos, y la validación de resultados.