Articles of Estadísticas

Python: ¿una forma fácil de hacer media geométrica en python?

Me pregunto si hay alguna manera fácil de hacer una media geométrica usando python pero sin usar el paquete python. Si no hay, ¿hay algún paquete simple para hacer la media geométrica?

Paquete Python que admite el cálculo de covarianza ponderada

¿Existe un paquete estadístico de Python que admita el cálculo de covarianza ponderada (es decir, cada observación tiene un peso)? Desafortunadamente numpy.cov no soporta pesos. Preferiblemente, trabajar bajo un marco numpy / scipy (es decir, capaz de usar matrices numpy para acelerar el cálculo). ¡Muchas gracias!

Diferencia en los resultados de GLM entre iPython y R

Estoy tratando de familiarizarme con la realización de análisis de regresión en R. A continuación, se incluyen algunos datos ficticios aleatorios que generé en R, ejecute un plan logístico en R. He guardado los datos en un archivo de prueba, lo he leído en python ipython (el cuaderno de ipython es impresionante por cierto, ¡acabo […]

¿Es correcta mi implementación en python del Índice Davies-Bouldin?

Estoy tratando de calcular el índice de Davies-Bouldin en Python. Estos son los pasos que el código siguiente intenta reproducir. 5 pasos : Para cada grupo, calcule distancias euclidianas entre cada punto y el centroide Para cada grupo, calcule el promedio de estas distancias Para cada par de grupos, calcule la distancia euclidiana entre sus […]

Vectorización del CDF normal multivariado (función de densidad acumulada) en Python

¿Cómo puedo vectorizar el CDF normal multivariado (función de densidad acumulada) en Python? Al mirar esta publicación, descubrí que hay una implementación de Fortran de la CDF multivariable que se “trasladó” a Python. Esto significa que puedo evaluar fácilmente el CDF para un caso específico. Sin embargo, estoy teniendo muchos problemas para aplicar esta función […]

Los valores de salida difieren entre R y Python?

Quizás estoy haciendo algo mal mientras normalizo mi matriz. ¿Alguien puede echarle un vistazo a esto y sugerir qué está pasando? En R: > data data.mean data.sd data.norm print(data.norm) [1] -0.9796808 -0.8622706 -0.6123005 0.8496459 1.7396910 1.5881940 1.0958286 0.5277147 0.4709033 -0.2865819 [11] 0.0921607 -0.2865819 -0.9039323 -1.1955641 -1.2372258 En Python usando numpy: >>> import string >>> import […]

Acumulador estadístico en python

Un acumulador estadístico permite realizar cálculos incrementales. Por ejemplo, para calcular la media aritmética de un flujo de números dados en tiempos arbitrarios, se podría hacer un objeto que haga un seguimiento del número actual de elementos dados, n y su sum, sum . Cuando uno solicita la media, el objeto simplemente devuelve sum/n . […]

Modelo Dinámico Simple en PyMC3

Estoy tratando de armar un modelo de un sistema dynamic en PyMC3, para inferir dos parámetros. El modelo es el SIR básico, comúnmente utilizado en epidemiología: dS / dt = – r0 * g * S * I dI / dt = g * I (r * S – 1) donde r0 y g son […]

En Python, ¿cómo puedo calcular la correlación y la significación estadística entre dos matrices de datos?

Tengo conjuntos de datos con dos conjuntos de datos igualmente largos, o puedo hacer un conjunto de entradas de dos elementos, y me gustaría calcular la correlación y la significación estadística representada por los datos (que pueden estar estrechamente correlacionadas, o pueden tener sin correlación estadísticamente significativa). Estoy progtwigndo en Python y tengo scipy y […]

Pandas corr () devolviendo NaN demasiado a menudo

Estoy intentando ejecutar lo que creo que debería ser una función de correlación simple en un dataframe, pero está devolviendo NaN a lugares donde no creo que deba. Código: # setup import pandas as pd import io csv = io.StringIO(u”’ id date num A 2018-08-01 99 A 2018-08-02 50 A 2018-08-03 100 A 2018-08-04 100 […]