Articles of estadísticas de

¿Cómo calculo el PDF (función de densidad de probabilidad) en Python?

Tengo el siguiente código a continuación que imprime el gráfico PDF para una media y una desviación estándar en particular. View post on imgur.com Ahora necesito encontrar la probabilidad real, de un valor particular. Entonces, por ejemplo, si mi media es 0 y mi valor es 0, mi probabilidad es 1. Esto generalmente se hace […]

Estadística para histogtwig de datos periódicos.

Para una serie de valores de ángulo en el rango (-pi, pi), hago un histogtwig. ¿Existe una manera efectiva de calcular una media y un valor modal (post probable)? Considere los siguientes ejemplos: import numpy as N, cmath deg = N.pi/180. d = N.array([-175., 170, 175, 179, -179])*deg i = N.sum(N.exp(1j*d)) ave = cmath.phase(i) i […]

Errores estándar inesperados con mínimos cuadrados ponderados en Python Pandas

En el código de la clase principal de OLS en Python Pandas , busco ayuda para aclarar qué convenciones se usan para el error estándar y las estadísticas t que se informan cuando se realiza el OLS ponderado. Aquí está mi ejemplo de conjunto de datos, con algunas importaciones para usar Pandas y usar scikits.statsmodels […]

¿Cómo puedo determinar los valores altos y bajos en una serie de datos cíclicos?

Tengo algunos datos que representan movimiento periódico. Entonces, va de lo alto a lo bajo y vuelve otra vez; Si fueras a trazarlo, te gustaría una onda sinusoidal. Sin embargo, la amplitud varía ligeramente en cada ciclo. Me gustaría hacer una lista de cada máximo y mínimo en toda la secuencia. Si hubiera 10 ciclos […]

¿Cómo se calculan las “bandas de error” en Seaborn tsplot?

Estoy tratando de entender cómo se calculan las bandas de error en el tsplot. Aquí se muestran ejemplos de las bandas de error. Cuando trazo algo simple como sns.tsplot(np.array([[0,1,0,1,0,1,0,1], [1,0,1,0,1,0,1,0], [.5,.5,.5,.5,.5,.5,.5,.5]])) Obtengo una línea vertical en y=0.5 como se esperaba. La banda de error superior también es una línea vertical alrededor de y=0.665 y la […]

¿Es correcta mi implementación en python del Índice Davies-Bouldin?

Estoy tratando de calcular el índice de Davies-Bouldin en Python. Estos son los pasos que el código siguiente intenta reproducir. 5 pasos : Para cada grupo, calcule distancias euclidianas entre cada punto y el centroide Para cada grupo, calcule el promedio de estas distancias Para cada par de grupos, calcule la distancia euclidiana entre sus […]

¿Por qué los statsmodels no pueden reproducir los resultados de la regresión logística R?

Estoy confundido acerca de por qué mis modelos de regresión logística en R y statsmodels no están de acuerdo. Si preparo algunos datos en R con # From https://courses.edx.org/c4x/MITx/15.071x/asset/census.csv library(caTools) # for sample.split census = read.csv(“census.csv”) set.seed(2000) split = sample.split(census$over50k, SplitRatio = 0.6) censusTrain = subset(census, split==TRUE) censusTest = subset(census, split==FALSE) y luego ejecutar una […]

¿Correlación intraclase en el módulo Python?

Estoy buscando para calcular la correlación intraclase (ICC) en Python. No he podido encontrar un módulo existente que tenga esta característica. ¿Hay un nombre alternativo, o debo hacerlo yo mismo? Soy consciente de que esta pregunta se hizo hace un año en Cross Validated por otro usuario, pero no hubo respuestas. Estoy mirando para comparar […]

Prueba de Chi Cuadrado usando Frecuencias, Contenedores, CDF, Python

Estoy tratando de escribir una prueba de bondad de ajuste de chi square para la distribución Beta desde cero, sin usar ninguna función externa. El código que aparece a continuación indica ‘1’ para un ajuste, aunque kstest de scipy.stats devuelve un cero. Los datos se distribuyen normalmente, por lo que mi función también debe devolver […]

¿Cómo calcular el valor de p para dos listas de flotadores?

Así que tengo listas de flotadores. Como [1.33,2.555,3.2134,4.123123] etc. Esas listas son frecuencias medias de algo. ¿Cómo puedo probar que dos listas son diferentes? Pensé en calcular el valor de p ¿Hay una función para hacer eso? Miré a través de la documentación de scipy, pero no pude averiguar qué usar. ¿Alguien puede por favor […]