Predicción utilizando Pandas OLS

He estado usando la función de predicción OLS de scikits.statsmodels para pronosticar datos ajustados, pero ahora me gustaría cambiar a usar Pandas.

La documentación hace referencia a OLS , así como a una función llamada y_predict, pero no puedo encontrar ninguna documentación sobre cómo usarla correctamente.

A modo de ejemplo:

exogenous = { "1998": "4760","1999": "5904","2000": "4504","2001": "9808","2002": "4241","2003": "4086","2004": "4687","2005": "7686","2006": "3740","2007": "3075","2008": "3753","2009": "4679","2010": "5468","2011": "7154","2012": "4292","2013": "4283","2014": "4595","2015": "9194","2016": "4221","2017": "4520"} endogenous = { "1998": "691", "1999": "1580", "2000": "80", "2001": "1450", "2002": "555", "2003": "956", "2004": "877", "2005": "614", "2006": "468", "2007": "191"} import numpy as np from pandas import * ols_test = ols(y=Series(endogenous), x=Series(exogenous)) 

Sin embargo, si bien puedo producir un ajuste:

 >>> ols_test.y_fitted 1998 675.268299 1999 841.176837 2000 638.141913 2001 1407.354228 2002 600.000352 2003 577.521485 2004 664.681478 2005 1099.611292 2006 527.342854 2007 430.901264 

La predicción no produce nada diferente:

 >>> ols_test.y_predict 1998 675.268299 1999 841.176837 2000 638.141913 2001 1407.354228 2002 600.000352 2003 577.521485 2004 664.681478 2005 1099.611292 2006 527.342854 2007 430.901264 

En scikits.statsmodels uno haría lo siguiente:

 import scikits.statsmodels.api as sm ... ols_model = sm.OLS(endogenous, np.column_stack(exogenous)) ols_results = ols_mod.fit() ols_pred = ols_mod.predict(np.column_stack(exog_prediction_values)) 

¿Cómo hago esto en Pandas para pronosticar los datos endógenos hasta los límites de lo exógeno?

ACTUALIZACIÓN: Gracias a Chang, la nueva versión de Pandas (0.7.3) ahora tiene esta funcionalidad como estándar.

¿Su problema es cómo obtener los valores de y predichos de su regresión? ¿O es cómo usar los coeficientes de regresión para obtener valores de y predichos para un conjunto diferente de muestras para las variables exógenas? pandas y_predict y y_fitted deberían darle el mismo valor y ambos deberían darle los mismos valores que el método de predicción en scikits.statsmodels.

Si estás buscando los coeficientes de regresión, haz ols_test.beta