Articles of Estadísticas

Regresión lineal multivariante en pymc3

Recientemente comencé a aprender pymc3 después de usar emcee de forma exclusiva durante años y tengo algunos problemas conceptuales. Estoy practicando con el Capítulo 7 de Hogg’s Fitting a model to data . Esto implica un ajuste de mcmc a una línea recta con incertidumbres 2d arbitrarias. Lo he logrado con bastante facilidad en el […]

generando números correlacionados en números / pandas

Estoy tratando de generar calificaciones de estudiantes simuladas en 4 materias, donde un registro de estudiante es una sola fila de datos. El código que se muestra aquí generará números aleatorios normalmente distribuidos con una media de 60 y una desviación estándar de 15. df = pd.DataFrame(15 * np.random.randn(5, 4) + 60, columns=[‘Math’, ‘Science’, ‘History’, […]

¿Cómo hacer una muestra aleatoria de datos lognormales en Python usando el CDF inverso y especificar los percentiles objective?

Estoy intentando generar muestras aleatorias de una distribución lognormal en Python, la aplicación es para simular el tráfico de red. Me gustaría generar muestras tales que: El resultado de la muestra modal es 320 (~ 10 ^ 2.5) 80% de las muestras se encuentran dentro del rango de 100 a 1000 (10 ^ 2 a […]

Python: ¿una forma fácil de hacer media geométrica en python?

Me pregunto si hay alguna manera fácil de hacer una media geométrica usando python pero sin usar el paquete python. Si no hay, ¿hay algún paquete simple para hacer la media geométrica?

Paquete Python que admite el cálculo de covarianza ponderada

¿Existe un paquete estadístico de Python que admita el cálculo de covarianza ponderada (es decir, cada observación tiene un peso)? Desafortunadamente numpy.cov no soporta pesos. Preferiblemente, trabajar bajo un marco numpy / scipy (es decir, capaz de usar matrices numpy para acelerar el cálculo). ¡Muchas gracias!

Diferencia en los resultados de GLM entre iPython y R

Estoy tratando de familiarizarme con la realización de análisis de regresión en R. A continuación, se incluyen algunos datos ficticios aleatorios que generé en R, ejecute un plan logístico en R. He guardado los datos en un archivo de prueba, lo he leído en python ipython (el cuaderno de ipython es impresionante por cierto, ¡acabo […]

¿Es correcta mi implementación en python del Índice Davies-Bouldin?

Estoy tratando de calcular el índice de Davies-Bouldin en Python. Estos son los pasos que el código siguiente intenta reproducir. 5 pasos : Para cada grupo, calcule distancias euclidianas entre cada punto y el centroide Para cada grupo, calcule el promedio de estas distancias Para cada par de grupos, calcule la distancia euclidiana entre sus […]

Vectorización del CDF normal multivariado (función de densidad acumulada) en Python

¿Cómo puedo vectorizar el CDF normal multivariado (función de densidad acumulada) en Python? Al mirar esta publicación, descubrí que hay una implementación de Fortran de la CDF multivariable que se “trasladó” a Python. Esto significa que puedo evaluar fácilmente el CDF para un caso específico. Sin embargo, estoy teniendo muchos problemas para aplicar esta función […]

Los valores de salida difieren entre R y Python?

Quizás estoy haciendo algo mal mientras normalizo mi matriz. ¿Alguien puede echarle un vistazo a esto y sugerir qué está pasando? En R: > data data.mean data.sd data.norm print(data.norm) [1] -0.9796808 -0.8622706 -0.6123005 0.8496459 1.7396910 1.5881940 1.0958286 0.5277147 0.4709033 -0.2865819 [11] 0.0921607 -0.2865819 -0.9039323 -1.1955641 -1.2372258 En Python usando numpy: >>> import string >>> import […]

Acumulador estadístico en python

Un acumulador estadístico permite realizar cálculos incrementales. Por ejemplo, para calcular la media aritmética de un flujo de números dados en tiempos arbitrarios, se podría hacer un objeto que haga un seguimiento del número actual de elementos dados, n y su sum, sum . Cuando uno solicita la media, el objeto simplemente devuelve sum/n . […]