¿Puede alguien explicarme la diferencia entre ols en statsmodel.formula.api versus ols en statsmodel.api? Usando los datos de publicidad del texto ISLR, corrí un historial usando ambos, y obtuve diferentes resultados. Luego comparé con la regresión lineal de scikit-learn. import numpy as np import pandas as pd import statsmodels.formula.api as smf import statsmodels.api as sm from […]
En el modelo de estadísticas es fácil agregar término de interacción. Sin embargo, no todas las interacciones son significativas. Mi pregunta es ¿cómo dejar caer aquellos que son insignificantes? Por ejemplo, el aeropuerto de Kootenay. # -*- coding: utf-8 -*- import pandas as pd import statsmodels.formula.api as sm if __name__ == “__main__”: # Read data […]
Los resultados de OLS df2 = pd.read_csv(“MultipleRegression.csv”) X = df2[[‘Distance’, ‘CarrierNum’, ‘Day’, ‘DayOfBooking’]] Y = df2[‘Price’] X = add_constant(X) fit = sm.OLS(Y, X).fit() print(fit.summary()) muestra los valores de P de cada atributo a solo 3 decimales. Necesito extraer el valor p para cada atributo como Distance , CarrierNum , etc. e imprimirlo en notación científica. […]
Estoy intentando implementar una regresión lineal multivariable en Python utilizando TensorFlow, pero me he topado con algunos problemas lógicos y de implementación. Mi código arroja el siguiente error: Attempting to use uninitialized value Variable Caused by op u’Variable/read’ Idealmente, la salida de weights debería ser [2, 3] def hypothesis_function(input_2d_matrix_trainingexamples, output_matrix_of_trainingexamples, initial_parameters_of_hypothesis_function, learning_rate, num_steps): # calculate […]
Comencé con la implementación simple de un descenso de gradiente lineal de una sola variable, pero ¿no sé cómo extenderlo al algoritmo de descenso de gradiente estocástico multivariado? Regresión lineal de una sola variable import tensorflow as tf import numpy as np # create random data x_data = np.random.rand(100).astype(np.float32) y_data = x_data * 0.5 # […]