En el modelo de estadísticas es fácil agregar término de interacción. Sin embargo, no todas las interacciones son significativas. Mi pregunta es ¿cómo dejar caer aquellos que son insignificantes? Por ejemplo, el aeropuerto de Kootenay. # -*- coding: utf-8 -*- import pandas as pd import statsmodels.formula.api as sm if __name__ == “__main__”: # Read data […]
Los resultados de OLS df2 = pd.read_csv(“MultipleRegression.csv”) X = df2[[‘Distance’, ‘CarrierNum’, ‘Day’, ‘DayOfBooking’]] Y = df2[‘Price’] X = add_constant(X) fit = sm.OLS(Y, X).fit() print(fit.summary()) muestra los valores de P de cada atributo a solo 3 decimales. Necesito extraer el valor p para cada atributo como Distance , CarrierNum , etc. e imprimirlo en notación científica. […]
Soy bastante nuevo en progtwigción y me lanzo a python para familiarizarme con el análisis de datos y el aprendizaje automático. Estoy siguiendo un tutorial sobre la eliminación hacia atrás para una regresión lineal múltiple. Aquí está el código ahora mismo: # Importing the libraries import numpy as np import matplotlib.pyplot as plt import pandas […]