¿Cuál es la diferencia entre inferencia y predicción en el aprendizaje automático?

Creo que no hay mucha diferencia (al menos conceptualmente). Inferencia significa estimar los valores de alguna variable (generalmente aleatoria oculta) dada alguna observación. Esto suele ser en un contexto PGM. La predicción generalmente se realiza en un contexto de aprendizaje supervisado donde, dado un punto de datos, podemos predecir (por ejemplo, por ejemplo, alguna etiqueta y). En este contexto y es una (variable oculta) estamos prediciendo a partir de datos visibles x (y probablemente muchos otros ejemplos, por ejemplo, un conjunto de datos). Así que en cierto sentido son lo mismo. Ambos requieren estimar el valor de algo oculto de datos conocidos.

Para una diferencia interesante, en una PGM se puede estimar todo el modelo con datos (es decir, un gráfico de variables conectadas de alguna manera, con suerte útil). Una vez que se conoce el modelo real, se puede ejecutar el motor de inferencia en él. Lo que eso significa es que, dado un conjunto de observaciones de las variables del modelo, uno puede (en principio, aunque sea computacionalmente difícil) predecir cualquier distribución posterior del modelo. Por lo general, la inferencia es el cálculo de P (Y | X) donde X e Y son cualquier conjunto de variables (y con eso hacen MAP, el posterior más probable si desea que se vea “predictivo” como un modelo discriminatorio, es decir, le proporcione un concreto concreto) valor). Este tipo de motor flexible de predicción / inferencia es posible en una PGM pero no es tan simple en un modelo supervisado / discriminado.

Entonces, para finalizar, tal vez la inferencia puede considerarse un poquito más general, ya que calcula una P posterior (Y | X) y, por lo general, una predicción simple implica obtener un solo valor (como MAP). Pero P (Y | X) sigue siendo una predicción en mi cabeza, solo con el beneficio adicional de una distribución de confianza en tu estado de creencia.

Espero eso ayude.

(también como se puede decir, también es una forma de usar el idioma / palabra en contexto. La predicción es más para modelos supervisados, mientras que la inferencia se usa más para modelos generativos)

En la predicción, no nos importa necesariamente por qué sucede algo o cómo cada variable se afecta entre sí . Veamos un ejemplo:

Supongamos que trabaja para una compañía de seguros de automóviles y su jefe le encarga predecir si los futuros clientes sufrirán un accidente. Revisa los datos, analiza algunos modelos y descubres que cuanto más bajo es el puntaje crediticio de una persona, mayor es la probabilidad de que tenga un accidente automovilístico (esto es cierto, por cierto). ¿Porqué es eso? A quien le importa. No importa. Lo que importa es que existe una relación entre la puntuación de crédito y los accidentes automovilísticos y podemos predecir mejor el resultado. Entonces, si llega un nuevo cliente y tiene un puntaje de crédito bajo, sabemos que debemos aumentar los precios de sus seguros. Fin de la historia.

En la inferencia, sin embargo, puede que nos importe por qué sucede algo.

Digamos que trabajas para una compañía de bienes raíces y tu jefe quiere saber sobre los precios de la vivienda y cómo se efectúan. Obtiene un conjunto de datos de Zillow, que tiene una serie de atributos que van de acuerdo con los precios de la vivienda, como el número de habitaciones, el tamaño del patio trasero, etc. En la inferencia, haríamos un poco más que solo predecir el precio de la casa. Nos gustaría decir algo como “Por cada 10 pies adicionales de espacio en el patio trasero, podemos esperar que el precio de una casa aumente en $ 5000”. En este caso, nos preocupa cómo las variables predictoras afectan la respuesta y es posible que tengan que ahondar. en por qué eso es.

Espero que esto ayude.