¿Cuál es la diferencia entre predicción e intervalos de confianza?

Supongamos que estoy ajustando un modelo de regresión lineal simple sin intercepción. El modelo es [math] y = \ beta x + \ epsilon [/ math] con todas las suposiciones estándar sobre [math] \ epsilon [/ math]. En particular, el valor esperado de [math] \ epsilon [/ math] es cero.

Dado un nuevo valor de [math] x [/ math] que llamaré [math] x_0 [/ math], hay dos cosas que puedo estimar:

  1. El valor promedio de [math] y [/ math] cuando [math] x = x_0 [/ math].
  2. El valor de [math] y [/ math] en una observación específica cuando [math] x = x_0 [/ math].

El intervalo de confianza mide cuánta incertidumbre hay en la primera estimación, mientras que el intervalo de predicción mide cuánta incertidumbre hay en la segunda estimación. A medida que obtengo más datos, hay menos incertidumbre en ambas cantidades. La diferencia es que el intervalo de confianza finalmente colapsará en un solo punto en el límite, mientras que el intervalo de predicción nunca será tan estrecho. Esto se debe a que hay más información sobre el promedio en una muestra más grande, pero no hay más información sobre una sola observación.