¿Cuál es el significado de un intervalo de confianza del 95%?

Siempre me ha gustado esta interpretación de los intervalos de confianza: de todos los intervalos de confianza del 90% que se han calculado, esperamos que el 90% de ellos contenga el parámetro verdadero. Esto evita la incómoda interpretación “si tuviera que repetir este procedimiento muchas veces …”.

Pero para abordar directamente su pregunta: ” ¿El 95% de intervalo de confianza significa que hay un 95% de probabilidad de que el valor verdadero se encuentre dentro de este intervalo?”

Si no ha realizado el procedimiento, puede decir correctamente “Si realizo este procedimiento y calculo un intervalo de confianza del 90%, entonces existe una probabilidad del 90% de que el parámetro esté en este intervalo de confianza” Esto se debe a que el parámetro es un constante, mientras que el intervalo de confianza es la variable aleatoria que aún no se ha realizado.

Sin embargo, después de realizar el procedimiento, la interpretación frecuentista es que el parámetro y los intervalos de confianza ahora son constantes, no variables aleatorias. La probabilidad de que el parámetro esté en el intervalo de confianza es 100% o 0%. Esa es la interpretación frecuentista.

Si no es un frecuentista, entonces es presumiblemente bayesiano, en cuyo caso, los intervalos de confianza no están definidos. Hay un intervalo creíble análogo – Wikipedia. Incluso después de calcular un intervalo creíble del 95%, todavía hay una probabilidad del 95% de que el parámetro se encuentre en el intervalo creíble.

TLDR: Si no has hecho el procedimiento, la respuesta es sí. Pero ya has hecho el procedimiento y eres frecuentista, entonces no. Si eres un bayesiano, entonces no estarías calculando un intervalo de confianza, sino un intervalo creíble.

EDITAR: Se eliminó la analogía del lanzamiento de monedas según el comentario de Justin.

EDITAR: Se agregó interpretación bayesiana según lo solicitado por Clay.

Lo que es:
Un intervalo construido, basado en los datos observados, con un procedimiento tal que si repitiera el proceso muestreado mediante el cual se obtuvieron los datos observados y la construcción del intervalo de confianza con el procedimiento especificado, la fracción de los intervalos de confianza que contiene el parámetro de población Ser el 95%.

Lo que NO es:
Un intervalo construido de tal manera que el parámetro de población se encuentre en el intervalo de confianza el 95% del tiempo.

En las estadísticas frecuentistas, la segunda afirmación ni siquiera tiene ningún significado. Y los bayesianos no llaman a las cosas “intervalos de confianza”.

(editado para ser mas precisos)

Comencemos por entender qué queremos decir cuando especificamos el intervalo del intervalo de confianza en un nivel de confianza específico.

Si estamos estimando la media de la población, especificamos el intervalo del intervalo de confianza como media de la muestra – margen de error y media de la muestra + margen de error.

Aquí, tanto la media de la muestra como el margen de error dependen de la muestra y se calculan a partir de los valores de la muestra (excepto cuando tenemos información previa sobre la población estándar dev.).

Por lo tanto, si la media real de la población (que es un valor constante) cae en el rango calculado es binaria (un Sí o un NO). Por lo tanto, no podemos especificar una probabilidad alrededor de la media de la población que cae en el intervalo del intervalo de confianza.

¿Cómo interpretar niveles de confianza y rangos del 95%?

Si repetimos el mismo experimento varias veces , cada vez que se extrae una muestra, se calcula el rango del intervalo de confianza y se comprueba si la media de la población cae en este rango , en el 95% de estos casos existe la posibilidad de que la media real de la población se encuentre en el rango calculado.

Antes, realiza el experimento y calcula el intervalo del intervalo de confianza, aún puede interpretar el nivel de confianza% como probabilidad de que la media real de la población caiga en el intervalo del intervalo de confianza que se calculará.

Sin embargo, una vez que se realiza el experimento y se calcula un rango, ya no es una cuestión de probabilidad, sino que es puramente binario.

¿Qué inferir de un solo experimento?

  • El intervalo del intervalo de confianza depende de la media de la muestra y de la muestra std.devn (Valores en la muestra) para un nivel de confianza dado. Por lo tanto, la posibilidad de que el valor verdadero de la población caiga en el intervalo del intervalo de confianza está directamente relacionada con la selectividad / representación de nuestra muestra.

Para obtener más información sobre los intervalos de confianza, consulte mis publicaciones Intervalos de confianza – Práctica de estadísticas AP y Cálculo de intervalos de confianza – Práctica de estadísticas AP

Saludos

Uday

Preparación para el examen de estadísticas AP – Ejemplos resueltos y pruebas de práctica

Supongamos que después de un examen se trata de una conversación entre usted y su padre.
F: Así que hijo, ¿cómo estuvo el examen? ¿Cuánto esperas?
Tu: Definitivamente voy a pasar. Obtendrá alrededor de 45-50.
F: ¿Estás seguro?
Tu: Estoy 90% seguro.

La forma en que respondió a la pregunta es un ejemplo de un intervalo de confianza.

Ahora usando una descripción más detallada.
Supongamos que queremos estimar un determinado parámetro de población; por ejemplo, el peso medio de las hembras indias. Hay dos formas de responder eso.

Al principio se toma una muestra de la población de mujeres indias. Hay que creer que esa muestra es una buena representación de toda la población. Luego calculas el peso medio (sea x) de la muestra y dices que x es el peso promedio de las hembras indias. Este método se llama la estimación puntual.

Además, puede realizar algunos cálculos más (que involucran la distribución de probabilidad de la muestra) y encontrar dos números L y U (L se llama límite inferior y U se denomina límite superior). Se supone que este intervalo (L, U) debe contener su respuesta con cierta probabilidad predefinida (un nivel de precisión). Finalmente, responde que el peso promedio de las mujeres indias cae entre (L, U) con una probabilidad de 0,95.
Este intervalo se conoce como el intervalo de confianza y esa probabilidad se denomina coeficiente de confianza (generalmente se usa el porcentaje de la probabilidad, 95% en este caso). Este método se conoce como estimación de intervalo.

Nota: el coeficiente de confianza es un nivel de precisión que el examinador desea y está determinado desde el principio. Dependiendo de este valor se calculan los límites inferior y superior.

En la mayoría de los casos, proporcionarle a alguien un presupuesto sin darles una idea de cuán preciso es realmente su presupuesto podría no ser útil. Si me preguntas qué tan pesado es un elefante africano macho adulto típico, podría decirte que creo que la respuesta es de aproximadamente 12,000 libras y eso sería útil. Sin embargo, si le digo que la respuesta es 12,000 libras más o menos 500 libras, eso significa algo muy diferente que si le digo que es 12,000 libras más o menos 5 libras.

Así que esa es la primera gran idea con un intervalo de confianza. Le proporciona un rango de valores para la estimación en lugar de un solo valor para que tenga una idea de la precisión con la que se ha realizado la estimación.

Pero también hay una segunda gran idea con intervalos de confianza. Surge porque en las estadísticas, el modelado aleatorio hace que sea imposible estar seguro de que su estimación es correcta (incluso cuando proporciona un rango como se explicó anteriormente). Siempre hay una pequeña posibilidad de que los datos que utilizó para elaborar la estimación fueran atípicos. (Por ejemplo, si realiza una muestra aleatoria de estudiantes varones en una universidad para estimar la estatura promedio, es posible, aunque improbable, que las 10 personas que muestre estén en el equipo de baloncesto y se encuentren entre los 10 hombres más altos del campus. mala suerte, tus datos siempre pueden engañarte.)

Entonces, ¿cómo explica esta posibilidad de tener datos desafortunados que matan su estimación? No solo proporciona una gama de valores en los que cree que se encuentra la verdadera respuesta, sino que también proporciona una declaración acerca de su confianza en que la verdadera respuesta se encuentra en algún lugar de ese rango.

Podría decirle que tengo una confianza del 99% (según los datos que he recopilado) de que el elefante africano macho promedio pesa entre 11,500 y 12,500 libras. Eso es un intervalo de confianza. Ofrece un rango de valores (11,500, 12,500) y una medida de cuánta confianza tengo en que la respuesta real vive en ese rango.

Ahora puedes decir: “Espera. Ese intervalo es de 1,000 libras de ancho. ¡Necesito saber la respuesta más precisamente que eso!” Si es así, tengo dos opciones. Primero, puedo darle un rango más estrecho: tal vez de 11,750 a 12,250 libras. Pero eso viene con un costo. Ya no estoy 99% seguro de que la respuesta real está en este nuevo rango (porque es más estrecho). Tal vez ahora solo tengo un 80% de confianza. Este es otro intervalo de confianza. El 80% confía en que la respuesta se encuentra dentro de 250 libras (en cualquier caso) de 12,000.

Pero eso apenas parece satisfactorio. Le he dado un rango más estrecho de valores al precio de estar menos seguro de que la respuesta está realmente en ese rango. Probablemente no era lo que esperabas cuando pediste saber la respuesta con mayor precisión. Eso nos lleva a la segunda opción. Puedo recoger más datos. Esa es realmente la ÚNICA manera en que puedo mantener el nivel de confianza en el 99% y reducir el ancho del intervalo. Resulta que si quisiera reducir el ancho del intervalo en un factor de dos (de 1000 a 500 libras) sin perder la confianza del 99%, tendría que recopilar datos de 4 veces más elefantes. Ese proceso puede ser costoso y llevar mucho tiempo.

Así que siempre hay una compensación. Puede obtener un intervalo de confianza más estrecho al reducir su nivel de confianza o al recopilar más datos. No hay otra opción.

Sigue siendo incorrecto. El 95% no es para el intervalo construido, sino para el método de construcción del intervalo, por lo general, las estadísticas de muestra más menos el margen de error. Una vez que el intervalo se construye a partir de la muestra, el parámetro está dentro, con probabilidad de 1, o fuera con una probabilidad de 1.

Imagina que estás en un carnaval y juegas el juego de aros sobre una botella. La botella es estática y los aros son dinámicos e intentan capturar la botella. Si desea tener mucha confianza en la captura de la botella, use aros grandes. Dígale que si desea tener la confianza de capturar la botella en 95 de cada 100 lanzamientos, deberá elegir los aros en consecuencia.

Aquí la botella es el parámetro, donde los aros caen después de que lanzas el intervalo de confianza y el 95% es el nivel de confianza que tienes al capturar la botella usando los aros.

Esto es lo que realmente es:
Si utilizara un método / fórmula para construir 100 intervalos de confianza a partir de 100 muestras aleatorias diferentes, aproximadamente 95 de ellas contendrán el parámetro que estoy tratando de estimar.

En términos prácticos, representa confianza en la metodología para construir el intervalo.

Es decir, el 95% de las veces, un intervalo construido utilizando este método en un experimento repetido identificará el valor verdadero.

En realidad es un poco complicado. CI = error tipo 1-I). Error de tipo I significa falso -ve.

Como sabemos, el error de tipo II es falso + ve y es más grave que el error de tipo I.

Para controlar esto necesitamos aumentar el tamaño de la muestra de manera suficiente, pero aún quedará poco si el control para reducir el ERROR de tipo II introducimos artificialmente el error de tipo I.

Ahora, para el intérprete, el 95% significa que el error de tipo I es del 5%, es decir, sus datos del 95% no tendrán el elemento falso + ve. En otras palabras, sus datos del 95% tienen homogeneidad sin argumentos.

de otra manera podemos decir que 1/20 = 0.05 y 19/20 = 0.95 si registramos un proceso con 20 observaciones y la certeza es 19 entre todos, entonces podemos decir que el proceso es cierto y 1 en 20 es un error aceptable. esta aceptabilidad es conceptual en teoría, pero empíricamente el investigador puede cambiar según el tamaño del efecto, la cantidad de muestras y la importancia del tema.

Esto significa que, con una probabilidad del 95%, el valor de una variable aleatoria estará entre los límites superior e inferior del intervalo. Digamos que está modelando su ganancia, pero no puede saber el valor exacto de la misma (la variable aleatoria), por lo que genera un intervalo de confianza (95% o 90% …) para saber dónde estará su ganancia, para que pueda expresar más precisamente el beneficio esperado, digamos sus inversionistas … con un 95% de certeza, nuestro beneficio estará entre 100 y 110 …

No. La definición frecuentista de intervalo de confianza (IC) es que si realiza 100 experimentos y calcula el IC, según su fórmula de IC, para algún parámetro de interés, 95 de estos 100 IC incluirán el valor verdadero de parámetro.

Espero que usted conozca estadísticas básicas, como qué es CI, estimación de puntos, puntuación Z, error estándar.

Supongamos que tomamos muchas muestras y construimos un intervalo de confianza de cada muestra usando la ecuación {punto estimado – Z * SE, punto estimado + Z * SE}. Entonces el 95% de esos intervalos contendría el verdadero parámetro de población.

es decir, tenemos un 95% de confianza de que el parámetro de población se encuentra entre el rango calculado

Muestra la fiabilidad de un producto que se fabrica. Según el nivel de confianza del 95%, cuando produce 100 unidades de un producto, 5 unidades de ellas son productos defectuosos. Además, el valor sigma de este nivel de confianza es z = 1.96 en la industria. En realidad, este valor sigma no es muy bueno. Debe ser al menos 2.5.

Es una pregunta relacionada con las estadísticas de negocios de ayuda. Esto significa que cuando ejecuta una prueba para verificar la hipótesis, los datos estadísticos de su muestra se encuentran dentro del rango del 95%, es decir, de su muestra que está seguro de que sus datos son correctos durante el 95% del tiempo.