Articles of statsmodels

Regresión Logit multinomial / condicional, ¿Por qué StatsModel falla en el ejemplo del paquete mlogit?

Estoy tratando de reproducir un ejemplo de una regresión logit multinomial del paquete mlogit en R. data(“Fishing”, package = “mlogit”) Fish <- mlogit.data(Fishing, varying = c(2:9), shape = "wide", choice = "mode") #a pure "conditional" model summary(mlogit(mode ~ price + catch, data = Fish)) Para reproducir este ejemplo con la función statsmodel MNLogit, exporto el […]

numpy y statsmodels dan diferentes valores al calcular las correlaciones. ¿Cómo interpretar esto?

No puedo encontrar una razón por la que calcular la correlación entre dos series A y B usando numpy.correlate me da resultados diferentes a los que statsmodels.tsa.stattools.ccf usando statsmodels.tsa.stattools.ccf Aquí hay un ejemplo de esta diferencia que menciono: import numpy as np from matplotlib import pyplot as plt from statsmodels.tsa.stattools import ccf #Calculate correlation using […]

Python – StatsModels, intervalo de confianza OLS

En Statsmodels puedo ajustar mi modelo usando import statsmodels.api as sm X = np.array([22000, 13400, 47600, 7400, 12000, 32000, 28000, 31000, 69000, 48600]) y = np.array([0.62, 0.24, 0.89, 0.11, 0.18, 0.75, 0.54, 0.61, 0.92, 0.88]) X2 = sm.add_constant(X) est = sm.OLS(y, X2) est2 = est.fit() luego imprima un buen resumen usando print(est2.summary()) y el extracto […]

Modelo StatesSpace.SARIMAX: por qué el modelo usa todos los datos para entrenar, y predice el rango de un modelo de tren.

Seguí el tutorial para estudiar el modelo SARIMAX: https://www.digitalocean.com/community/tutorials/a-guide-to-time-series-forecasting-with-arima-in-python-3 . El rango de fechas de los datos es 1958-2001. mod = sm.tsa.statespace.SARIMAX(y, order=(1, 1, 1), seasonal_order=(1, 1, 1, 12), enforce_stationarity=False, enforce_invertibility=False) results = mod.fit() cuando estoy ajustando un modelo de serie temporal ARIMA, encontré al autor todos los datos del rango de fechas para ajustar […]

Predicción de valores usando un modelo OLS con modelos de estadísticas

Calculé un modelo utilizando OLS (regresión lineal múltiple). Dividí mis datos para entrenar y probar (la mitad de cada uno), y luego me gustaría predecir valores para la segunda mitad de las tags. model = OLS(labels[:half], data[:half]) predictions = model.predict(data[half:]) El problema es que recibo un error: Archivo “/usr/local/lib/python2.7/dist-packages/statsmodels-0.5.0-py2.7-linux-i686.egg/statsmodels/regression/linear_model.py” , linea 281, en el retorno […]

Invertible de un modelo ARIMA.

Estoy tratando de escribir un código para generar una serie de modelos arima y comparar diferentes modelos. El código es el siguiente. p=0 q=0 d=0 pdq=[] aic=[] for p in range(6): for d in range(2): for q in range(4): arima_mod=sm.tsa.ARIMA(df,(p,d,q)).fit(transparams=True) x=arima_mod.aic x1= p,d,q print (x1,x) aic.append(x) pdq.append(x1) keys = pdq values = aic d = […]

Pandas con efectos fijos

Estoy usando Pandas en Python 2.7. Tengo datos con las siguientes columnas: estado, año, tasa de desempate, salario Estoy enseñando un curso sobre cómo usar Python para la investigación. Como la culminación de nuestro proyecto, quiero realizar una regresión de UnempRate en el control de salarios para efectos fijos estatales y anuales. Puedo hacer esto […]

Predecir los valores futuros mediante la regresión OLS (Python, StatsModels, Pandas)

Actualmente estoy intentando implementar un MLR en Python y no estoy seguro de cómo aplico los coeficientes que he encontrado a los valores futuros. import pandas as pd import statsmodels.formula.api as sm import statsmodels.api as sm2 TV = [230.1, 44.5, 17.2, 151.5, 180.8] Radio = [37.8,39.3,45.9,41.3,10.8] Newspaper = [69.2,45.1,69.3,58.5,58.4] Sales = [22.1, 10.4, 9.3, 18.5,12.9] […]

Python pandas no tiene atributos ols – Error (Rolling OLS)

Para mi evaluación, quería ejecutar una OLS regression estimation de OLS regression estimation 1000 ventanas rodantes del conjunto de datos que se encuentra en esta URL: https://drive.google.com/open?id=0B2Iv8dfU4fTUa3dPYW5tejA0bzg usando el siguiente script Python . # /usr/bin/python -tt import numpy as np import matplotlib.pyplot as plt import pandas as pd from statsmodels.formula.api import ols df = pd.read_csv(‘estimated.csv’, […]

Errores estándar inesperados con mínimos cuadrados ponderados en Python Pandas

En el código de la clase principal de OLS en Python Pandas , busco ayuda para aclarar qué convenciones se usan para el error estándar y las estadísticas t que se informan cuando se realiza el OLS ponderado. Aquí está mi ejemplo de conjunto de datos, con algunas importaciones para usar Pandas y usar scikits.statsmodels […]