Articles of estadísticas de

Statsmodels da diferentes resultados de ANOVA a SPSS

Me estoy familiarizando con Statsmodels para cambiar mis estadísticas más complicadas por completo a python. Sin embargo, estoy siendo cauteloso, así que estoy verificando mis resultados con SPSS, solo para asegurarme de que no estoy cometiendo errores obvios. La mayoría de las veces, no hay diferencia, pero tengo un ejemplo de un ANOVA de dos […]

¿Cómo calcular el modo para un campo en un archivo CSV?

Tengo este archivo de texto: Category;currency;sellerRating;Duration;endDay;ClosePrice;OpenPrice;Competitive? Music/Movie/Game;US;3249;5;Mon;0,01;0,01;No Music/Movie/Game;US;3249;5;Mon;0,01;0,01;No Music/Movie/Game;US;3249;5;Mon;0,01;0,01;No Music/Movie/Game;US;3249;5;Mon;0,01;0,01;No Music/Movie/Game;US;3249;5;Mon;0,01;0,01;No Music/Movie/Game;US;3249;5;Mon;0,01;0,01;No Music/Movie/Game;US;3249;5;Mon;0,01;0,01;No Automotive;US;3115;7;Tue;0,01;0,01;No Automotive;US;3115;7;Tue;0,01;0,01;No Automotive;US;3115;7;Tue;0,01;0,01;Yes Quiero calcular la mediana de cada categoría. Entonces, por ejemplo, quiero calcular el modo de sellerRating . Tengo esto hasta ahora (porque también necesitaba calcular los promedios pero logré hacerlo): import csv import locale import statistics from pprint import […]

Función de distribución empírica en Numpy

Tengo la siguiente lista de valores: x = [-0.04124324405924407, 0, 0.005249724476788287, 0.03599351958245578, -0.00252785423151014, 0.01007584102031178, -0.002510349639322063,…] y quiero calcular la función de densidad empírica, así que creo que necesito calcular la función de distribución acumulativa empírica y he usado este código: counts = np.asarray(np.bincount(x), dtype=float) cdf = counts.cumsum() / counts.sum() y luego calculo este valor: print […]

Producto de dos distribuciones beta.

Digamos que tengo dos variables aleatorias: X ~ Beta (α1, β1) Y ~ Beta (α2, β2) Me gustaría calcular la distribución de Z = XY (el producto de las variables aleatorias) Con scipy , puedo obtener el pdf de una sola Beta con: from scipy.stats import beta rv = beta(a, b) x = np.linspace(start=0, stop=1, […]

Prueba de ADF en statsmodels en Python

Estoy intentando realizar una prueba de Dickey-Fuller aumentada en statsmodels de statsmodels en Python, pero parece que me falta algo. Este es el código que estoy intentando: import numpy as np import statsmodels.tsa.stattools as ts x = np.array([1,2,3,4,3,4,2,3]) result = ts.adfuller(x) Obtuve el siguiente error: Traceback (most recent call last): File “C:\Users\Akavall\Desktop\Python\Stats_models\stats_models_test.py”, line 12, in […]

PDF extraños de datos ajustados de máxima verosimilitud de valores extremos generalizados (GEV)

Estoy haciendo un análisis de datos que involucra ajustar conjuntos de datos a una distribución de Valor Extremo Generalizado (GEV), pero estoy obteniendo algunos resultados extraños. Esto es lo que estoy haciendo: from scipy.stats import genextreme as gev import numpy data = [1.47, 0.02, 0.3, 0.01, 0.01, 0.02, 0.02, 0.12, 0.38, 0.02, 0.15, 0.01, 0.3, […]

Escalado del PDF ajustado de una distribución log-normal al histrogtwig en python

Tengo un conjunto de muestras distribuido de log-normal y quiero realizar un ajuste a él. Luego quiero trazar tanto el histogtwig de las muestras como el PDF ajustado en una sola gráfica, y me gustaría usar la escala original para el histogtwig. Mi pregunta: ¿Cómo escalar directamente el PDF para que sea visible en el […]

¿Cómo se calcula el valor de R2 en Scikit learn?

El valor R ^ 2 devuelto por scikit learn ( metrics.r2_score() ) puede ser negativo. Los docs dicen: “A diferencia de la mayoría de las otras puntuaciones, la puntuación de R² puede ser negativa (en realidad no es el cuadrado de una cantidad R)”. Sin embargo, el artículo de wikipedia sobre R ^ 2 no […]

Una distribución lognormal en python

He visto varias preguntas en stackoverflow con respecto a cómo ajustar una log-normal distribution . Todavía hay dos aclaraciones que necesito conocer. Tengo una muestra de datos, cuyo logaritmo sigue una distribución normal. Así que puedo ajustar los datos usando scipy.stats.lognorm.fit (es decir, una log-normal distribution ) El ajuste está funcionando bien, y también me […]

calculando el coeficiente de Gini en Python / numpy

Estoy calculando el coeficiente de Gini (similar a: Python – Cálculo del coeficiente de Gini usando Numpy ) pero obtengo un resultado impar. para una distribución uniforme muestreada de np.random.rand() , el coeficiente de Gini es de 0,3, pero habría esperado que estuviera cerca de 0 (igualdad perfecta). ¿Qué está mal aquí? def G(v): bins […]