Prueba de Chi Square de Pearson Python

Tengo dos matrices que me gustaría hacer una prueba Chi Square de Pearson (bondad de ajuste). Quiero probar si hay o no una diferencia significativa entre los resultados esperados y observados.

observed = [11294, 11830, 10820, 12875] expected = [10749, 10940, 10271, 11937] 

Quiero comparar 11294 con 10749, 11830 con 10940, 10820 con 10271, etc.

Esto es lo que tengo

 >>> from scipy.stats import chisquare >>> chisquare(f_obs=[11294, 11830, 10820, 12875],f_exp=[10749, 10940, 10271, 11937]) (203.08897607453906, 9.0718379533890424e-44) 

donde 203 es el estadístico de prueba de chi cuadrado y 9.07e-44 es el valor p. Estoy confundido por los resultados. p-value = 9.07e-44 <0.05 por lo tanto, rechazamos la hipótesis nula y concluimos que existe una diferencia significativa entre los resultados observados y esperados. Esto no es correcto porque los números están muy cerca. ¿Cómo puedo solucionar esto?

En general, la hipótesis nula (H0) dice que las dos variables (X e Y) son independientes, es decir, cambiar los valores en X no afectaría los valores en Y.

Por ejemplo, X = [1,2,3,4] e Y = [2,4,6,8]

Si calcula el “valor p” utilizando cualquier método para este caso, debería ser un valor muy pequeño, lo que implica que existe una probabilidad muy baja de que este caso siga la hipótesis nula, es decir, una probabilidad muy baja. que X e Y son independientes el uno del otro

Significa que nunca seguirá la hipótesis nula aquí y estas dos variables dependen una de la otra, en una forma de Y = 2X.

También en su caso, la puntuación de p-valor de 9.0718379533890424e-44 significa lo mismo, es decir, un valor pequeño indica que hay una probabilidad muy baja de que sea suficiente la hipótesis nula y significa que lo observado y lo esperado están relacionados entre sí y existe No hay independencia entre ellos.

PD. Usted tiene razón sobre esto.