Articles of regresión

¿Cómo extraer la ecuación de un ajuste polinomial?

Mi objective es ajustar algunos datos a una función polinomial y obtener la ecuación real, incluidos los valores de los parámetros ajustados. Adapté este ejemplo a mis datos y el resultado es el esperado. Aquí está mi código: import numpy as np import matplotlib.pyplot as plt from sklearn.linear_model import Ridge from sklearn.preprocessing import PolynomialFeatures from […]

Diferencia entre la interacción: y * término para las fórmulas en la regresión StatsModels OLS

Hola, estoy aprendiendo Statsmodel y no puedo entender la diferencia entre: y * (términos de interacción) para las fórmulas en la regresión StatsModels OLS. ¿Podría por favor darme una pista para resolver esto? ¡Gracias! La documentación: http://statsmodels.sourceforge.net/devel/example_formulas.html

Distinguir el exceso de ajuste vs buena predicción

Estas son preguntas sobre cómo calcular y reducir el sobreajuste de aprendizaje automático. Creo que muchas de las novedades en el aprendizaje automático tendrán las mismas preguntas, así que traté de ser claro con mis ejemplos y preguntas con la esperanza de que las respuestas aquí puedan ayudar a otros. Tengo una muestra muy pequeña […]

Regresión lineal simple múltiple de Python

Tenga en cuenta que esta no es una pregunta acerca de la regresión múltiple, sino que se trata de realizar una regresión simple (variable única) varias veces en Python / NumPy (2.7). Tengo dos m x n matrices x y y . Las filas se corresponden entre sí, y cada par es el conjunto de […]

Regresión del proceso gaussiano de múltiples salidas en scikit-learn

Estoy utilizando scikit learn para la operación de regresión del proceso gaussiano (GPR) para predecir datos. Mis datos de entrenamiento son los siguientes: x_train = np.array([[0,0],[2,2],[3,3]]) #2-D cartesian coordinate points y_train = np.array([[200,250, 155],[321,345,210],[417,445,851]]) #observed output from three different datasources at respective input data points (x_train) Los puntos de prueba (2-D) donde se debe predecir […]

¿Multivariable (polinomio) mejor curva de ajuste en python?

¿Cómo se calcula una línea de mejor ajuste en python y luego se grafica en un diagtwig de dispersión en matplotlib? Calculé la línea lineal de mejor ajuste utilizando la Regresión de mínimos cuadrados ordinarios de la siguiente manera: from sklearn import linear_model clf = linear_model.LinearRegression() x = [[t.x1,t.x2,t.x3,t.x4,t.x5] for t in self.trainingTexts] y = […]

¿Cómo podemos encajar una señal en la función sigmoide en Python?

Estoy trabajando con un conjunto de datos simple y por razones de reproducibilidad, lo comparto aquí . Para aclarar lo que estoy haciendo, de la columna 2, estoy leyendo la fila actual y la comparo con el valor de la fila anterior. Si es mayor, sigo comparando. Si el valor actual es más pequeño que […]

AttributeError: el módulo ‘xgboost’ no tiene atributo ‘XGBRegressor’

Estoy intentando ejecutar xgboost utilizando spyder y python, pero sigo recibiendo este error: AttributeError: el módulo ‘xgboost’ no tiene atributo ‘XGBRegressor’ Aquí está el código: import xgboost as xgb xgb.XGBRegressor(max_depth=3, learning_rate=0.1, n_estimators=100, silent=True, objective=’reg:linear’, gamma=0, min_child_weight=1, max_delta_step=0, subsample=1, colsample_bytree=1, seed=0, missing=None) Error es Traceback (most recent call last): File “”, line 1, in xgb.XGBRegressor(max_depth=3, learning_rate=0.1, […]

Valores de clip de regresión de keras.

Quiero recortar valores, ¿cómo podría hacer eso? Intenté usar esto: from keras.backend.tensorflow_backend import clip from keras.layers.core import Lambda … model.add(Dense(1)) model.add(Activation(‘linear’)) model.add(Lambda(lambda x: clip(x, min_value=200, max_value=1000))) Pero no importa dónde coloque mi clip Lambda +, ¿no afecta nada?

Ejecutar una regresión OLS con Pandas Data Frame

Tengo un dataframe de pandas y me gustaría poder predecir los valores de la columna A a partir de los valores de las columnas B y C. Aquí hay un ejemplo de juguete: import pandas as pd df = pd.DataFrame({“A”: [10,20,30,40,50], “B”: [20, 30, 10, 40, 50], “C”: [32, 234, 23, 23, 42523]}) Idealmente, tendría […]