Contenido
Una discrepancia es un valor en un conjunto de datos que está lejos de otros valores. Las discrepancias pueden deberse a errores experimentales o de medición. En los primeros casos, puede ser conveniente identificar valores atípicos y eliminarlos de los demás datos antes de realizar un análisis estadístico para evitar afectar los resultados, ya que no representan con precisión la población de la muestra. La forma más sencilla de identificar discrepancias es con el método de cuartiles.
Paso 1
Enumere los datos en orden ascendente. Considere el conjunto de datos {4, 5, 2, 3, 15, 3, 3, 5}. Ordenado, el ejemplo del conjunto de datos es: {2, 3, 3, 3, 4, 5, 5, 15}.
Paso 2
Encuentra la mediana. Este es el número central, que divide la mitad mayor de la mitad menor. Si hay un número par de datos, se debe calcular el promedio de los dos. Por ejemplo: en el conjunto de datos citado, los puntos medios son 3 y 4, por lo que la mediana es (3 + 4) / 2 = 3,5.
Paso 3
Encuentre el punto de datos del cuartil superior, Q2, que divide al grupo entre el 75% más pequeño y el 25% más grande. Si el conjunto de datos es par, promedia dos puntos alrededor del cuartil. En el ejemplo anterior: (5 + 5) / 2 = 5.
Paso 4
Encuentre el cuartil más bajo, Q1, el punto de datos que separa el 25% más pequeño del 75% más grande. Si el conjunto de datos es par, promedia dos puntos alrededor del cuartil. En el ejemplo: (3 + 3) / 2 = 3.
Paso 5
Reste el cuartil inferior del cuartil superior para obtener el rango intercuartílico, IQ. En el ejemplo: Q2 - Q1 = 5 - 3 = 2.
Paso 6
Multiplica el rango intercuartil por 1,5. Suma el cuartil superior al resultado y resta el cuartil inferior. Cualquier punto de datos fuera de estos valores es una discrepancia leve. Para el ejemplo dado: 1.5 x 2 = 3. 3 - 3 = 0 y 5 +3 = 8. Por lo tanto, cualquier valor menor que 0 o mayor que 8 sería una pequeña discrepancia. Esto significa que 15 califica como una discrepancia leve.
Paso 7
Multiplique el rango intercuartil por 3. Sume al cuartil superior y reste el cuartil inferior. Cualquier punto de datos fuera de estos valores es una discrepancia extrema. Para el ejemplo dado, 3 x 2 = 6. 3-6 = -3 y 5 + 6 = 11. Por lo tanto, cualquier valor menor que -3 o mayor que 11 es una discrepancia extrema. Esto significa que 15 califica como una discrepancia extrema.