Articles of statsmodels

Statsmodels da diferentes resultados de ANOVA a SPSS

Me estoy familiarizando con Statsmodels para cambiar mis estadísticas más complicadas por completo a python. Sin embargo, estoy siendo cauteloso, así que estoy verificando mis resultados con SPSS, solo para asegurarme de que no estoy cometiendo errores obvios. La mayoría de las veces, no hay diferencia, pero tengo un ejemplo de un ANOVA de dos […]

Producto de dos distribuciones beta.

Digamos que tengo dos variables aleatorias: X ~ Beta (α1, β1) Y ~ Beta (α2, β2) Me gustaría calcular la distribución de Z = XY (el producto de las variables aleatorias) Con scipy , puedo obtener el pdf de una sola Beta con: from scipy.stats import beta rv = beta(a, b) x = np.linspace(start=0, stop=1, […]

Regresión lineal mínima cuadrada ponderada no negativa en python

Sé que hay un solucionador OLS ponderado y un solucionador OLS restringido . ¿Hay alguna rutina que combine los dos?

Regresión OLS con groupby

Quiero ejecutar una regresión OLS usando pandas y un groupby. Estoy intentando el siguiente código: import pandas as pd from pandas.stats.api import ols df=pd.read_csv(r’F:\File.csv’) result=df.groupby([‘FID’]).apply(lambda x: ols(y=df[x[‘MEAN’]], x=df[x[‘Accum_Prcp’],x[‘Accum_HDD’]])) print result pero esto vuelve: File “C:\Users\spotter\AppData\Local\Continuum\Anaconda2\lib\site-packages\pandas\core\indexing.py”, line 1150, in _convert_to_indexer raise KeyError(‘%s not in index’ % objarr[mask]) KeyError: ‘[ 0.84978328 0.72115778 0.53965104 0.52955655 0.73372541 0.64617074\n 0.60040938 […]

Prueba de ADF en statsmodels en Python

Estoy intentando realizar una prueba de Dickey-Fuller aumentada en statsmodels de statsmodels en Python, pero parece que me falta algo. Este es el código que estoy intentando: import numpy as np import statsmodels.tsa.stattools as ts x = np.array([1,2,3,4,3,4,2,3]) result = ts.adfuller(x) Obtuve el siguiente error: Traceback (most recent call last): File “C:\Users\Akavall\Desktop\Python\Stats_models\stats_models_test.py”, line 12, in […]

Intervalos de confianza para la predicción del modelo.

Estoy siguiendo junto con un tutorial de statsmodels Un modelo OLS está equipado con formula = ‘S ~ C(E) + C(M) + X’ lm = ols(formula, salary_table).fit() print lm.summary() Los valores pronosticados se proporcionan a través de: lm.predict({‘X’ : [12], ‘M’ : [1], ‘E’ : [2]}) El resultado se devuelve como una matriz de valor […]

ECDF en python sin función de paso?

He estado usando ECDF (función de distribución acumulativa empírica) de statsmodels.distributions para trazar un CDF de algunos datos. Sin embargo, ECDF utiliza una función escalonada y, como consecuencia, tengo gráficos de aspecto irregular. Así que mi pregunta es: ¿tienen Scipy o statsmodels un ECDF horneado sin una función de paso? Por cierto, sé que puedo […]

La creación de un modelo de regresión múltiple genera un error: `Los datos de Pandas se convierten en un tipo de objeto numpy. Compruebe los datos de entrada con np.asarray (datos) .`

Tengo un dataframe de pandas con algunos predictores categóricos (es decir, variables) como 0 y 1, y algunas variables numéricas. Cuando encajé eso en un modelo como: est = sm.OLS(y, X).fit() Lanza: Pandas data cast to numpy dtype of object. Check input data with np.asarray(data). Convertí todos los tipos de datos del DataFrame usando df.convert_objects(convert_numeric=True) […]

Trazar intervalos de confianza y predicción con entradas repetidas

Tengo una gráfica de correlación para dos variables, la variable predictiva (temperatura) en el eje x, y la variable de respuesta (densidad) en el eje y. Mi mejor ajuste de la línea de regresión de mínimos cuadrados es un polinomio de segundo orden. También me gustaría trazar la confianza y los intervalos de predicción. El […]

Cómo visualizar una relación no lineal en un diagtwig de dispersión

Quiero explorar visualmente la relación entre dos variables. La forma funcional de la relación no es visible en diagtwigs de dispersión densos como este: ¿Cómo puedo agregar un toque suave al gráfico de dispersión en Python? ¿O tiene alguna otra sugerencia para explorar visualmente las relaciones no lineales? Intenté lo siguiente pero no funcionó correctamente […]