Apresenta fórmulas, para dados univariados, de detecção de outliers que
levem em conta a assimetria dos dados, tanto positiva como negativa. A nova
formulação, proveniente da Análise Exploratória de Dados, é simulada
comparando os resultados com a proposta oriunda da Análise Exploratória de
Dados, presente na maioria dos livros-textos de estatÃstica e softwares estatÃsticos,
mas que se aplica somente para distribuições normais ou gaussianas, ou seja,
simétricas ou com leve assimetria. Para a simulação, são utilizados dados reais
publicados por dois trabalhos na área de métricas cientÃficas. Para assimetrias
positivas (negativas) moderadas ou fortes, a nova formulação detecta menor
(maior) quantidade de outliers superiores que a proposta clássica. É importante
levar em conta a existência de outliers nos dados bibliométricos, pois recomendase
quantificar a influência dos mesmos nos cálculos estatÃsticos, tais como média e
desvio padrão.
This study presents formulas for detection of outliers for univariate
data, taking into consideration the positive as well as the negative asymmetry of
data. This new formula is based on the Exploratory Data Analysis and is
simulated through the comparison of the outcome of the Exploratory Data
Analysis found in statistical text books and statistical software. However, only
normal or Gaussian distribution, i.e., symmetric or slightly asymmetric values, are
applied. Real data published in two scientific papers on metrics are used for the
simulation. For moderate or strong positive (negative) asymmetries, the new
formulation detects a lower (higher) quantity of superior outliers. It is important to
take into account the existence of outliers in bibliometric data; it is recommended
to quantify the influence of outliers in statistical calculation, such as mean and
standard deviation.