Articles of Estadísticas

Estimación de corte exponencial en una distribución de ley de potencia.

Como he estado haciendo algunos análisis de redes sociales, me he topado con el problema de ajustar una distribución de probabilidad en el grado de la red. Entonces, tengo una distribución de probabilidad P(X >= x) que, de la inspección visual, sigue una ley de potencia con un corte exponencial en lugar de una ley […]

Calcular la función de distribución acumulativa (CDF) en Python

¿Cómo puedo calcular en Python la función de distribución acumulativa (CDF) ? Quiero calcularlo a partir de una serie de puntos que tengo (distribución discreta), no con las distribuciones continuas que, por ejemplo, tiene scipy.

Cómo implementar p.adjust de R en Python

Tengo una lista de valores p y me gustaría calcular los valores p de ajuste para comparaciones múltiples para el FDR . En R, puedo usar: pval <- read.csv("my_file.txt",header=F,sep="\t") pval <- pval[,1] FDR <- p.adjust(pval, method= "BH") print(length(pval[FDR<0.1])) write.table(cbind(pval, FDR),"pval_FDR.txt",row.names=F,sep="\t",quote=F ) ¿Cómo puedo implementar este código en Python? Aquí fue mi bash fallido en Python […]

¿Cómo muestrear incrementalmente sin reemplazo?

Python tiene my_sample = random.sample(range(100), 10) para muestrear aleatoriamente sin reemplazo de [0, 100) . Supongamos que he muestreado n tales números y ahora quiero muestrear uno más sin reemplazo (sin incluir ninguno de los n muestreados anteriormente), ¿cómo hacerlo de manera súper eficiente? actualización: cambiado de “razonablemente eficiente” a “súper eficiente” (pero ignorando factores […]

Calcule la probabilidad en la distribución normal dada la media, estándar en Python

¿Cómo calcular la probabilidad en la distribución normal dada la media, estándar en Python? Siempre puedo explícitamente codificar mi propia función de acuerdo con la definición que hizo el OP en esta pregunta: Cálculo de la probabilidad de una variable aleatoria en una distribución en Python Solo me pregunto si hay una llamada a la […]

Distribución normal sesgada en scipy

¿Alguien sabe cómo trazar una distribución normal sesgada con scipy? Supongo que se puede usar la clase stats.norm pero no puedo entender cómo. Además, ¿cómo puedo estimar los parámetros que describen la distribución normal oblicua de un conjunto de datos unidimensional?

¿Calculando el porcentaje de medida de varianza para k-medias?

En la página de Wikipedia , se describe un método de codo para determinar el número de agrupaciones en k-means. El método incorporado de scipy proporciona una implementación, pero no estoy seguro de entender cómo se calcula la distorsión, como la llaman. Más precisamente, si grafica el porcentaje de varianza explicado por los grupos contra […]

Cómo calcular las estadísticas “t-test” con numpy

Estoy buscando generar algunas estadísticas sobre un modelo que creé en Python. Me gustaría generar el t-test en él, pero me preguntaba si había una manera fácil de hacer esto con adormecer / escéptico. ¿Hay buenas explicaciones alrededor? Por ejemplo, tengo tres conjuntos de datos relacionados que se parecen a esto: [55.0, 55.0, 47.0, 47.0, […]

¿Cómo calculo r-squared usando Python y Numpy?

Estoy usando Python y Numpy para calcular un polinomio de mejor ajuste de grado arbitrario. Paso una lista de valores de x, valores de y, y el grado del polinomio que quiero ajustar (lineal, cuadrático, etc.). Esto funciona mucho, pero también quiero calcular r (coeficiente de correlación) y r cuadrado (coeficiente de determinación). Estoy comparando […]

¿Cálculo de la función de correlación cruzada?

En R , estoy usando ccf o acf para calcular la función de correlación cruzada por pares, de modo que pueda averiguar qué cambio me da el valor máximo. Por su aspecto, R me da una secuencia normalizada de valores. ¿Hay algo similar en el scipy de Python o se supone que debo hacerlo usando […]