Articles of Estadísticas

En Python, ¿cómo puedo calcular la correlación y la significación estadística entre dos matrices de datos?

Tengo conjuntos de datos con dos conjuntos de datos igualmente largos, o puedo hacer un conjunto de entradas de dos elementos, y me gustaría calcular la correlación y la significación estadística representada por los datos (que pueden estar estrechamente correlacionadas, o pueden tener sin correlación estadísticamente significativa). Estoy progtwigndo en Python y tengo scipy y […]

Pandas corr () devolviendo NaN demasiado a menudo

Estoy intentando ejecutar lo que creo que debería ser una función de correlación simple en un dataframe, pero está devolviendo NaN a lugares donde no creo que deba. Código: # setup import pandas as pd import io csv = io.StringIO(u”’ id date num A 2018-08-01 99 A 2018-08-02 50 A 2018-08-03 100 A 2018-08-04 100 […]

¿Encontrar el punto de codo de una curva de forma estable?

Soy consciente de la existencia de esto , y esto en este tema. Sin embargo, me gustaría finalizar en una implementación real en Python esta vez. Mi único problema es que el punto del codo parece estar cambiando de diferentes instancias de mi código. Observa las dos plots que se muestran en este post. Si […]

Cómo obtener la correlación entre dos series temporales utilizando Pandas

Tengo dos series de fecha de temperatura, que tienen lecturas a intervalos de tiempo regulares (pero diferentes). Estoy tratando de obtener la correlación entre estos dos conjuntos de datos. He estado jugando con Pandas para tratar de hacer esto. He creado dos series TimeSeriesA.corr(TimeSeriesB) y estoy usando TimeSeriesA.corr(TimeSeriesB) . Sin embargo, si los tiempos en […]

¿Cuál es la mejor solución de código abierto para almacenar datos de series de tiempo?

Estoy interesado en monitorear algunos objetos. Espero obtener unos 10000 puntos de datos cada 15 minutos. (Tal vez no al principio, pero este es el ‘estadio general’). También me gustaría poder obtener estadísticas diarias, semanales, mensuales y anuales. No es crítico mantener los datos en la resolución más alta (15 minutos) durante más de dos […]

Mezcla separada de gaussianos en Python

Hay un resultado de algún experimento físico, que se puede representar como un histogtwig [i, amount_of(i)] . Supongo que ese resultado puede estimarse mediante una mezcla de 4 – 6 funciones gaussianas. ¿Hay un paquete en Python que tome un histogtwig como entrada y devuelva la media y la varianza de cada distribución gaussiana en […]

Cómo hacer una muestra aleatoria ponderada de categorías en Python

Dada una lista de tuplas en la que cada tupla consta de una probabilidad y un elemento, me gustaría muestrear un elemento según su probabilidad. Por ejemplo, indique la lista [(.3, ‘a’), (.4, ‘b’), (.3, ‘c’)] Me gustaría muestrear ‘b’ el 40% del tiempo. ¿Cuál es la forma canónica de hacer esto en python? He […]

Código de Python para las emisiones de monedas.

He estado escribiendo un progtwig en python que simula 100 lanzamientos de monedas y da el número total de lanzamientos. El problema es que también quiero imprimir el número total de cabezas y colas. Aquí está mi código: import random tries = 0 while tries < 100: tries += 1 coin = random.randint(1, 2) if […]

¿La matriz de covarianza de np.polyfit () tiene diagonal negativa?

Problema: la opción cov=True de np.polyfit() produce una diagonal con valores negativos sin sentido. ACTUALIZACIÓN: después de jugar con esto un poco más, ¿ realmente estoy empezando a sospechar un error en el número ? ¿Es eso posible? Eliminar cualquier par de 13 valores del conjunto de datos solucionará el problema. Estoy usando np.polyfit() para […]

Pruebas de estadísticas (Kolmogorov y T-test) con Python y Rpy2

He ejecutado algunos algoritmos y quería hacer un análisis estadístico con los resultados. Tengo dos vectores con los promedios de la tasa de error. Con R, usando la línea de abajo obtendría todo. t.test(methodresults1,methodresults2,var.equal=FALSE,paird=FALSE,alternative=”less”) Ya que estoy usando Python, quería usar el proyecto Rpy2. Intenté eso: import rpy2.robjects as R # methodresults1 and methodresults2 are […]