¿Qué usar para hacer correlación múltiple?

Estoy tratando de usar python para calcular la regresión lineal múltiple y la correlación múltiple entre una matriz de respuesta y un conjunto de matrices de predictores. Vi el ejemplo muy simple para calcular la regresión lineal múltiple, que es fácil. Pero, ¿cómo calcular la correlación múltiple con statsmodels? O con cualquier otra cosa, como alternativa. Supongo que podría usar rpy y R, pero preferiría quedarme en Python si es posible.

editar [aclaración]: considerando una situación como la que se describe aquí: http://sphweb.bumc.bu.edu/otlt/MPH-Modules/BS/BS704-EP713_MultivariableMethods/ Me gustaría calcular también múltiples coeficientes de correlación para los predictores , además de los coeficientes de regresión y los demás parámetros de regresión

Ciertamente podrías hacer esto con statsmodels y pandas. Algo como esto podría hacerte comenzar

import pandas import statsmodels.api as sm from statsmodels.formula.api import ols data = pandas.DataFrame([["A", 4, 0, 1, 27], ["B", 7, 1, 1, 29], ["C", 6, 1, 0, 23], ["D", 2, 0, 0, 20], ["etc.", 3, 0, 1, 21]], columns=["ID", "score", "male", "age20", "BMI"]) print data.corr() model = ols("BMI ~ score + male + age20", data=data).fit() print model.params print model.summary() 

Echa un vistazo a la documentación:

http://statsmodels.sourceforge.net/devel/

http://pandas.pydata.org/

Edit: No estoy familiarizado con la terminología del coeficiente de correlación múltiple, pero creo que esto es solo la raíz cuadrada del R cuadrado de un modelo de regresión múltiple, ¿no?

 print model.rsquared**.5 print model.rsquared_adj**.5 

¿Es esto lo que buscas?