¿Por qué los científicos de datos estaban tan equivocados con las elecciones presidenciales de 2016?

El problema no estaba en ningún dato sin procesar obtenido por los encuestadores, el problema clave estaba en una simple cuestión de ponderar las respuestas del partido político.

El porcentaje de afiliación a los partidos utilizado por algunos (la mayoría) de los encuestadores fue sobre la base de que el 38% de los votantes serían “demócratas”, el 32% “republicanos” y el resto “no afiliados u otros” (los índices de las elecciones de 2012).

Las encuestas de salida mostraron que dentro de cada uno de estos grupos las encuestas estaban bastante cerca. El problema fue que la ponderación de los demócratas debería haber estado más cerca del 35%, el GOP al 31% y la categoría “Otros” fue de alrededor del 34% (según los totales que se obtengan).

Si los encuestadores hubieran adivinado correctamente el porcentaje de pesos para dar a cada grupo , sus cifras habrían estado más cerca.

Nate Silver usó una simulación que permitió que esos valores cambiaran, y estuvo más cerca de ser correcto que cualquier póster individual.

El “perdedor” fue IPSOS, que había utilizado los cálculos de que casi el 40% de los votantes eran demócratas, y sugería que Hillary tenía un gran desprendimiento en sus manos.

GIGO.

Basura dentro basura fuera.

Sus datos de entrada se tomaron en gran medida de encuestas en sitios de medios que se inclinan hacia el HRC. Así que los resultados que obtuvieron fueron moderadamente o muy inclinados hacia ella.

Fue esencialmente una elección entre cambio y no cambio. Cualquiera que quisiera un cambio sabía que Clinton no lo haría. Así que recurrieron a la única otra opción, dejaron de frecuentar los sitios de noticias anteriores porque solo hay tantas veces que se puede pensar que eres un racista y deplorable antes de que te des cuenta de que no te están dando una audiencia justa.

Los recolectores de datos no tomaron en cuenta el tráfico que los nuevos medios de comunicación estaban recibiendo. En gran parte porque no han estado vinculados con el establecimiento y no estaban escupiendo bilis sobre cómo “MALA” y “MISMO” tenía que ser cualquiera a quien no le gustara Clinton. Y debido a que los nuevos medios de comunicación fueron mucho menos amigables con HRC, esto hizo que las escalas se alejaran de Clinton.

Hubo científicos de datos que predijeron una victoria republicana desde el principio. Es solo que los medios de comunicación los ignoraron.

El profesor que predijo 30 años de elecciones presidenciales correctamente convocó una victoria de Trump en septiembre