Cómo calcular la precisión y recuperar valores para un conjunto de datos

Supongamos que estamos evaluando la exactitud de la clasificación de sus predicciones de clase en comparación con las etiquetas de evaluación en una configuración de clase binaria.

Número de muestras = 10
Predicción real
+ +
+ –
+ –
+ +
+ +
– +
– –
– –
– +
– +

Ahora, necesitamos calcular los verdaderos positivos para las clases.
TP + = Número de positivos que se pronostican correctamente (predicho = real = positivo). Hay 6 predicciones positivas y de ellas 3 son correctas. Entonces TP + = 3.

TP- = Número de negativos que se pronostican correctamente (predicho = real = negativo). Hay 4 predicciones negativas y de ellas 2 son correctas, entonces TP- = 2.

Calculemos los falsos positivos para las clases ahora.
FP + = Número de positivos pronosticados que son incorrectos. Hay 6 positivos pronosticados y de ellos 3 son incorrectos, por lo que FP + = 3
FP- = Número de negativos pronosticados que son incorrectos. Hay 4 negativos pronosticados y, de ellos, 2 son incorrectos, entonces FP- = 2

Ahora la precisión se define como TP / (TP + FP)
Precisión + = TP + / (TP_pos + FP_pos) = 3 / (3 + 3) = 0.5 = 50%
Precisión- = TP – / (TP_neg + FP_neg) = 2 / (2 + 2) = 0.5 = 50%

Ahora no calculemos los falsos negativos.
FN + = Número de positivos que están clasificados incorrectamente. Aquí hay 2 positivos que están clasificados incorrectamente.
Igualmente FN- = Número de negativos que están clasificados incorrectamente. Aquí hay 3 negativos que están clasificados incorrectamente.

Ahora Recall = TP / (TP + FN)
Recordar + = 3 / (3 + 2) = 0.6 = 60%
Recall- = 2 / (2 + 3) = 0.4 = 40%

Puede encontrar Precisión y recordar útil para conocer métricas relevantes.

Puede utilizar el software de minería Weka-Data. Alimenta tus conjuntos de datos a weka, dará resultados.
@Data Mining con software de aprendizaje de código abierto de máquina en Java

Pues bien, la fórmula de precisión y recuerdo son:

precisión = TP / TP + FP
Recuperación o sensibilidad o tasa de TP = TP / TP + FN
TP significa Verdadero Positivo
FP significa Falso Positivo
FN significa Falso Negativo

Si tiene alguna duda al respecto, por favor pregunte. 🙂

La pregunta no está enmarcada correctamente. No encuentras precisión y recuperación para un conjunto de datos, sino para un algoritmo.