¿Cuáles serían algunos ejemplos de cuándo se preferiría la ‘media’ sobre la ‘mediana’?

Además del hecho de que miden diferentes propiedades de la distribución, una de las diferencias más importantes entre la media y la mediana es que la mediana es mucho menos sensible a los valores atípicos. Por lo tanto, cada vez que piense que existe una posibilidad razonable de que los valores atípicos se encuentren en su conjunto de datos, probablemente debería mantenerse alejado de la media y, en su lugar, usar la mediana. Entonces, a partir de este punto de la discusión, asumiremos que confiamos en que todos los datos son auténticos, por lo que es razonable pensar que la media de la muestra es un buen estimador de la media de la población.

Obviamente, si sus datos provienen de una distribución (casi) simétrica, la media y la mediana serán (casi) iguales. ¿Cuál es una mejor cantidad para estimar? Resulta que la media (si los datos son aproximadamente normales) es mejor, aunque la mediana también se comporta bien. Según la mediana:

Más específicamente, la mediana tiene una eficiencia del 64% en comparación con la media de varianza mínima (para muestras normales grandes), es decir, la varianza de la mediana será ~ 50% mayor que la varianza de la media …

Esta variación mayor nos dice que un intervalo de confianza construido usando la media será aproximadamente el 80% del ancho de uno construido usando la mediana (para el mismo número de puntos de datos y el mismo nivel de confianza). Entonces, si está seguro de que no tiene valores atípicos y que su distribución es casi simétrica y más o menos normal, es mejor que use la media. ¡Con qué frecuencia puede estar realmente seguro de cualquiera de estos puntos es algo completamente diferente !

La otra circunstancia que viene a la mente es cuando su distribución no es simétrica pero realmente desea saber la media de la población. La media probablemente no sea una medida de tendencia central tan intuitiva como la mediana para tales distribuciones, pero si es la propiedad que desea conocer (para poder estimar el total, por ejemplo), entonces la mediana de la muestra no va a te ayudo mucho. Debe confiar en la media de la muestra (y esperar que sus datos estén limpios).