Articles of Statistics

Es aleatoria.expariable equivalente a un proceso de Poisson

Leí en alguna parte que la función de la biblioteca python random.expariable produce intervalos equivalentes a los eventos del proceso de Poisson. ¿Es ese realmente el caso o debo imponer alguna otra función en los resultados?

Ajuste de la distribución lognormal usando Scipy vs Matlab

Estoy tratando de ajustar una distribución lognormal usando Scipy. Ya lo he hecho con Matlab antes, pero debido a la necesidad de extender la aplicación más allá del análisis estadístico, estoy intentando reproducir los valores ajustados en Scipy. A continuación se muestra el código de Matlab que solía ajustar a mis datos: % Read input […]

Ajuste binomial negativo en python

En scipy no hay soporte para ajustar una distribución binomial negativa utilizando datos (tal vez debido al hecho de que el binomio negativo en scipy es solo discreto). Para una distribución normal solo haría: from scipy.stats import norm param = norm.fit(samp) ¿Hay alguna función similar ‘lista para usar’ en otra biblioteca?

¿Ajustando los datos a las distribuciones?

No soy un estadístico (más de un desarrollador web de investigación) pero he estado escuchando mucho sobre scipy y R en estos días. Así que, por curiosidad, quise hacer esta pregunta (aunque podría parecer una tontería para los expertos de aquí) porque no estoy seguro de los avances en esta área y quiero saber cómo […]

Superposición de múltiples histogtwigs utilizando pandas

Tengo dos o tres archivos csv con el mismo encabezado y me gustaría dibujar los histogtwigs para cada columna superpuesta en la misma gráfica. El siguiente código me da dos figuras separadas, cada una con todos los histogtwigs de cada uno de los archivos. ¿Hay una manera compacta de trazarlos juntos en la misma figura […]

Gráficas de caja en matplotlib: marcadores y valores atípicos

Tengo algunas preguntas acerca de los diagtwigs de caja en matplotlib: Pregunta A. ¿Qué representan los marcadores que resalté a continuación con Q1 , Q2 y Q3 ? Creo que Q1 es máximo y Q3 son valores atípicos, pero ¿qué es Q2 ? Pregunta B ¿Cómo identifica matplotlib los valores atípicos ? (es decir, ¿cómo […]

Cómo hacer funciones definidas por el usuario para binned_statistic

Estoy usando el paquete de estadísticas scipy para llevar estadísticas a lo largo de un eje, pero tengo problemas para tomar la estadística de percentiles usando binned_statistic . He generalizado el código a continuación, donde estoy intentando tomar el percentil 10 de un conjunto de datos con valores x, y dentro de una serie de […]

¿Cómo calcular la probabilidad de ocurrencias en Python?

Estoy trabajando con tres conjuntos de datos simples y por razones de reproducibilidad, estoy compartiendo el conjunto de datos aquí . Para aclarar lo que estoy haciendo, de la columna 2, estoy leyendo la fila actual y la comparo con el valor de la fila anterior. Si es mayor, sigo comparando. Si el valor actual […]

Pandas: por qué pandas.Series.std () es diferente de numpy.std ()

Otra actualización: resuelta (ver comentarios y mi propia respuesta). Actualización: esto es lo que estoy tratando de explicar. >>> pd.Series([7,20,22,22]).std() 7.2284161474004804 >>> np.std([7,20,22,22]) 6.2599920127744575 Respuesta: esto se explica por la corrección de Bessel , N-1 lugar de N en el denominador de la fórmula de desviación estándar. Ojalá Pandas usara la misma convención que numpy. […]

NumPy o SciPy para calcular la mediana ponderada

Estoy tratando de automatizar un proceso que realiza JMP (Analizar-> Distribución, ingresando la columna A como el “valor Y”, utilizando las columnas subsiguientes como el valor del “peso”). En JMP, debe hacer esto una columna a la vez; me gustaría usar Python para recorrer todas las columnas y crear una matriz que muestre, por ejemplo, […]