Articles of Statistics

Correlación entre múltiples variables categóricas (pandas)

Tengo un conjunto de datos compuesto por 22 variables categóricas (no ordenadas). Me gustaría visualizar su correlación en un buen mapa de calor . Dado que los pandas construyeron en función DataFrame.corr(method=’pearson’, min_periods=1) solo implemento los coeficientes de correlación para las variables numéricas (Pearson, Kendall, Spearman), tengo que agregarlo yo mismo para realizar un chi-cuadrado […]

Cdf empírico en python similar al de Matlab.

Tengo un código en Matlab, que me gustaría reescribir en Python. Es un progtwig simple, que calcula alguna distribución y la grafica en una escala de doble registro. El problema que encontré es con la computación cdf. Aquí está el código matlab: for D = 1:10 delta = D / 10; for k = 1:n […]

Cómo calcular el error para el ajuste polinomial (en pendiente e intercepción)

Hola, quiero calcular los errores en la pendiente y la intersección que se calculan mediante la función scipy.polyfit. Tengo (+/-) incertidumbre para ydata, entonces, ¿cómo puedo incluirla para calcular la incertidumbre en pendiente e intercepción? Mi codigo es from scipy import polyfit import pylab as plt from numpy import * data = loadtxt(“data.txt”) xdata,ydata = […]

Regresión no lineal e ^ (- x) usando scipy, python, numpy

El siguiente código me está dando una línea plana para la línea de mejor ajuste en lugar de una curva agradable a lo largo del modelo de e ^ (- x) que se ajustaría a los datos. ¿Alguien me puede mostrar cómo arreglar el código siguiente para que se ajuste a mis datos? import numpy […]

Cálculo del promedio móvil por hora y de 2 horas para diferentes eventos en el dataframe de pandas

Tengo un dataframe como se muestra a continuación: Event DateTime ModFlow(cfs) ObsFlow(cfs) ModVol(f3) ObsVol(f3) Event 01 8/15/2016 3:10 0.7309299 0.6408669 219.27897 192.26007 Event 01 8/15/2016 3:15 0.7177225 0.3482972 215.31675 104.48916 Event 01 8/15/2016 3:20 0.7182343 0.5108359 215.47029 153.25077 Event 01 8/15/2016 3:25 0.7078446 0.6315789 212.35338 189.47367 Event 01 8/15/2016 3:30 0.6973493 0.5201238 209.20479 156.03714 Event […]

Escalado y ajuste a una distribución log-normal usando un eje logarítmico en python

Tengo un conjunto de muestras log-normal distribuido. Puedo visualizar las muestras utilizando un histrogtwig con eje x lineal o logarítmico. Puedo realizar un ajuste al histogtwig para obtener el PDF y luego escalarlo al histrogtwig en la gráfica con el eje x lineal, vea también esta pregunta previamente publicada . Sin embargo, no puedo trazar […]

Sumando sobre un nivel multiindex en una serie de pandas

Al usar el paquete Pandas en python, me gustaría sumr (marginar) más de un nivel en una serie con un índice múltiple de 3 niveles para producir una serie con un índice múltiple de 2 niveles. Por ejemplo, si tengo lo siguiente: ind = [tuple(x) for x in [‘ABC’, ‘ABc’, ‘AbC’, ‘Abc’, ‘aBC’, ‘aBc’, ‘abC’, […]

Cómo realizar una prueba t de una cola de dos muestras con numpy / scipy

En R , es posible realizar una prueba t de una cola de dos muestras simplemente usando > A = c(0.19826790, 1.36836629, 1.37950911, 1.46951540, 1.48197798, 0.07532846) > B = c(0.6383447, 0.5271385, 1.7721380, 1.7817880) > t.test(A, B, alternative=”greater”) Welch Two Sample t-test data: A and B t = -0.4189, df = 6.409, p-value = 0.6555 alternative […]

¿Cómo determinar cuál es la función de distribución de probabilidad de una matriz numpy?

He buscado alrededor y para mi sorpresa, parece que esta pregunta no ha sido respondida. Tengo una matriz Numpy que contiene 10000 valores de mediciones. He trazado un histogtwig con Matplotlib, y por inspección visual los valores parecen estar distribuidos normalmente: Sin embargo, me gustaría validar esto. He encontrado una prueba de normalidad implementada en […]

Regresión sigmoidal con scipy, numpy, python, etc.

Tengo dos variables (x e y) que tienen una relación un tanto sigmoidal entre sí, y necesito encontrar algún tipo de ecuación de predicción que me permita predecir el valor de y, dado cualquier valor de x. Mi ecuación de predicción necesita mostrar la relación algo sigmoidal entre las dos variables. Por lo tanto, no […]