Articles of statsmodels

Trazar intervalos de confianza y predicción con entradas repetidas

Tengo una gráfica de correlación para dos variables, la variable predictiva (temperatura) en el eje x, y la variable de respuesta (densidad) en el eje y. Mi mejor ajuste de la línea de regresión de mínimos cuadrados es un polinomio de segundo orden. También me gustaría trazar la confianza y los intervalos de predicción. El […]

Cómo visualizar una relación no lineal en un diagtwig de dispersión

Quiero explorar visualmente la relación entre dos variables. La forma funcional de la relación no es visible en diagtwigs de dispersión densos como este: ¿Cómo puedo agregar un toque suave al gráfico de dispersión en Python? ¿O tiene alguna otra sugerencia para explorar visualmente las relaciones no lineales? Intenté lo siguiente pero no funcionó correctamente […]

Series de tiempo de Holt-Winters pronosticando con statsmodels

Intenté pronosticar con el holt-winters model como se muestra a continuación, pero sigo obteniendo una predicción que no es consistente con lo que espero. También mostré una visualización de la ttwig. Train = Airline[:130] Test = Airline[129:] from statsmodels.tsa.holtwinters import Holt y_hat_avg = Test.copy() fit1 = Holt(np.asarray(Train[‘Passengers’])).fit() y_hat_avg[‘Holt_Winter’] = fit1.predict(start=1,end=15) plt.figure(figsize=(16,8)) plt.plot(Train.index, Train[‘Passengers’], label=’Train’) plt.plot(Test.index,Test[‘Passengers’], […]

Pandas Dataframe AttributeError: el objeto ‘DataFrame’ no tiene ningún atributo ‘design_info’

Estoy tratando de usar la función predict() de la implementación de statsmodels.formula.api OLS. Cuando paso un nuevo dataframe a la función para obtener valores pronosticados para un conjunto de datos fuera de muestra, result.predict(newdf) devuelve el siguiente error: ‘DataFrame’ object has no attribute ‘design_info’ . ¿Qué significa esto y cómo lo arreglo? El rastreo completo […]

Modelos de estadísticas de Python – término cuadrático en regresión

Tengo la siguiente regresión lineal: import statsmodels.formula.api as sm model = sm.ols(formula = ‘a ~ b + c’, data = data).fit() Quiero agregar un término cuadrático para b en este modelo. ¿Hay una forma sencilla de hacer esto con statsmodels.ols? ¿Hay un paquete mejor que debería usar para lograr esto?

Logit multinomial de Python con el módulo statsmodels: Cambiar el valor base de la regresión de mlogit

Tengo un pequeño problema con el que estoy atascado. Estoy creando un modelo logit multinomial con modelos de estadísticas de Python y deseo reproducir un ejemplo dado en un libro de texto. Hasta ahora todo bien, pero estoy luchando para establecer un valor objective diferente como el valor base para la regresión. ¿Alguien puede ayudar? […]

La predicción estacional de ARIMA con Python: x12a y x13 no se encuentra en la ruta

Estoy usando Statsmodels para implementar la predicción estacional de ARIMA para series de tiempo. Aquí está mi código: import statsmodels.api as sm from statsmodels.tsa.x13 import x13_arima_select_order, _find_x12 import pandas import scipy import numpy import imp data_source = imp.load_source(‘data_source’, ‘/mypath/’) def main(): data=data_source.getdata() res = x13_arima_select_order(data) print (res.order, res.sorder) main() Al ejecutar el código, obtengo esta […]

Diferencia entre la interacción: y * término para las fórmulas en la regresión StatsModels OLS

Hola, estoy aprendiendo Statsmodel y no puedo entender la diferencia entre: y * (términos de interacción) para las fórmulas en la regresión StatsModels OLS. ¿Podría por favor darme una pista para resolver esto? ¡Gracias! La documentación: http://statsmodels.sourceforge.net/devel/example_formulas.html

¿Errores estándar de Newey-West para OLS en Python?

Quiero tener un coeficiente y un error estándar de Newey-West asociado con él. Estoy buscando la biblioteca de Python (idealmente, pero cualquier solución que funcione está bien) que puede hacer lo que hace el siguiente código R: library(sandwich) library(lmtest) a <- matrix(c(1,3,5,7,4,5,6,4,7,8,9)) b <- matrix(c(3,5,6,2,4,6,7,8,7,8,9)) temp.lm = lm(a ~ b) temp.summ <- summary(temp.lm) temp.summ$coefficients <- […]

Diferencia en los modelos de estadísticas de Python OLS y R’s lm

No estoy seguro de por qué estoy obteniendo resultados ligeramente diferentes para un OLS simple, dependiendo de si utilizo la interfaz rpy experimental de panda para realizar la regresión en R o si uso statsmodels en Python. import pandas from rpy2.robjects import r from functools import partial loadcsv = partial(pandas.DataFrame.from_csv, index_col=”seqn”, parse_dates=False) demoq = loadcsv(“csv/DEMO.csv”) […]