Tengo conjuntos de datos con dos conjuntos de datos igualmente largos, o puedo hacer un conjunto de entradas de dos elementos, y me gustaría calcular la correlación y la significación estadística representada por los datos (que pueden estar estrechamente correlacionadas, o pueden tener sin correlación estadísticamente significativa). Estoy progtwigndo en Python y tengo scipy y […]
Estoy intentando ejecutar lo que creo que debería ser una función de correlación simple en un dataframe, pero está devolviendo NaN a lugares donde no creo que deba. Código: # setup import pandas as pd import io csv = io.StringIO(u”’ id date num A 2018-08-01 99 A 2018-08-02 50 A 2018-08-03 100 A 2018-08-04 100 […]
Soy consciente de la existencia de esto , y esto en este tema. Sin embargo, me gustaría finalizar en una implementación real en Python esta vez. Mi único problema es que el punto del codo parece estar cambiando de diferentes instancias de mi código. Observa las dos plots que se muestran en este post. Si […]
Tengo dos series de fecha de temperatura, que tienen lecturas a intervalos de tiempo regulares (pero diferentes). Estoy tratando de obtener la correlación entre estos dos conjuntos de datos. He estado jugando con Pandas para tratar de hacer esto. He creado dos series TimeSeriesA.corr(TimeSeriesB) y estoy usando TimeSeriesA.corr(TimeSeriesB) . Sin embargo, si los tiempos en […]
Estoy interesado en monitorear algunos objetos. Espero obtener unos 10000 puntos de datos cada 15 minutos. (Tal vez no al principio, pero este es el ‘estadio general’). También me gustaría poder obtener estadísticas diarias, semanales, mensuales y anuales. No es crítico mantener los datos en la resolución más alta (15 minutos) durante más de dos […]
Hay un resultado de algún experimento físico, que se puede representar como un histogtwig [i, amount_of(i)] . Supongo que ese resultado puede estimarse mediante una mezcla de 4 – 6 funciones gaussianas. ¿Hay un paquete en Python que tome un histogtwig como entrada y devuelva la media y la varianza de cada distribución gaussiana en […]
Dada una lista de tuplas en la que cada tupla consta de una probabilidad y un elemento, me gustaría muestrear un elemento según su probabilidad. Por ejemplo, indique la lista [(.3, ‘a’), (.4, ‘b’), (.3, ‘c’)] Me gustaría muestrear ‘b’ el 40% del tiempo. ¿Cuál es la forma canónica de hacer esto en python? He […]
He estado escribiendo un progtwig en python que simula 100 lanzamientos de monedas y da el número total de lanzamientos. El problema es que también quiero imprimir el número total de cabezas y colas. Aquí está mi código: import random tries = 0 while tries < 100: tries += 1 coin = random.randint(1, 2) if […]
Problema: la opción cov=True de np.polyfit() produce una diagonal con valores negativos sin sentido. ACTUALIZACIÓN: después de jugar con esto un poco más, ¿ realmente estoy empezando a sospechar un error en el número ? ¿Es eso posible? Eliminar cualquier par de 13 valores del conjunto de datos solucionará el problema. Estoy usando np.polyfit() para […]
He ejecutado algunos algoritmos y quería hacer un análisis estadístico con los resultados. Tengo dos vectores con los promedios de la tasa de error. Con R, usando la línea de abajo obtendría todo. t.test(methodresults1,methodresults2,var.equal=FALSE,paird=FALSE,alternative=”less”) Ya que estoy usando Python, quería usar el proyecto Rpy2. Intenté eso: import rpy2.robjects as R # methodresults1 and methodresults2 are […]