Articles of regresión

Python Keras cross_val_score Error

Estoy intentando hacer este pequeño tutorial sobre keras sobre regresión: http://machinelearningmastery.com/regression-tutorial-keras-deep-learning-library-python/ Desafortunadamente me estoy encontrando en un error que no puedo solucionar. Si solo copio y pego el código, aparece el siguiente error al ejecutar este fragmento de código: import numpy import pandas from keras.models import Sequential from keras.layers import Dense from keras.wrappers.scikit_learn import KerasRegressor […]

Ignorar los valores perdidos en la regresión OLS múltiple con modelos de estadísticas

Estoy intentando ejecutar una regresión OLS múltiple usando modelos de estadísticas y un dataframe de pandas. Faltan valores en diferentes columnas para diferentes filas, y sigo recibiendo el mensaje de error: ValueError: la matriz no debe contener infs ni NaN. Vi esta pregunta SO, que es similar pero no responde exactamente a mi pregunta: statsmodel.api. […]

Sklearn LogisticRegression y cambio del umbral predeterminado para la clasificación

Estoy usando LogisticRegression del paquete sklearn y tengo una pregunta rápida sobre la clasificación. Construí una curva ROC para mi clasificador, y resulta que el umbral óptimo para mis datos de entrenamiento es de alrededor de 0.25. Supongo que el umbral predeterminado al crear predicciones es 0.5. ¿Cómo puedo cambiar esta configuración predeterminada para averiguar […]

Obtención de modelos de estadísticas para utilizar los errores estándar corregidos de heteroscedasticidad en las pruebas t de coeficiente

He estado indagando en la API de statsmodels.regression.linear_model.RegressionResults y he encontrado cómo recuperar diferentes sabores de errores estándar corregidos de heteroscedasticidad (a través de propiedades como HC0_se , etc.) Sin embargo, no puedo averiguar cómo obtener Las pruebas t en los coeficientes para usar estos errores estándar corregidos. ¿Hay alguna manera de hacer esto en […]

Proceso Gaussiano scikit-learn – Excepción

Quiero usar los procesos gaussianos para resolver una tarea de regresión. Mi información es la siguiente: cada vector X tiene una longitud de 37, y cada vector Y tiene una longitud de 8. Estoy usando el paquete sklearn en Python pero tratar de usar procesos gaussianos conduce a una Exception : from sklearn import gaussian_process […]

El escalado del objective hace que la regresión SVM de Scikit-learn se descomponga

Cuando se entrena una regresión SVM, generalmente es recomendable escalar las características de entrada antes de entrenar. Pero ¿qué hay de la escala de los objectives? Por lo general, esto no se considera necesario y no veo una buena razón por la que debería ser necesario. Sin embargo, en el ejemplo de scikit-learn para regresión […]

Múltiples salidas en keras.

Tengo un problema que se relaciona con la predicción de dos salidas cuando se le da un vector de predictores. Supongamos que un vector predictor se parece a x1, y1, att1, att2, …, attn , que dice que x1, y1 son coordenadas y los att’s son los otros atributos asociados a la aparición de las […]

Python divide por cero en log – regresión logística

Estoy tratando de implementar un clasificador de regresión logística multiclase que distingue entre k clases diferentes. Este es mi código. import numpy as np from scipy.special import expit def cost(X,y,theta,regTerm): (m,n) = X.shape J = (np.dot(-(yT),np.log(expit(np.dot(X,theta))))-np.dot((np.ones((m,1))-y).T,np.log(np.ones((m,1)) – (expit(np.dot(X,theta))).reshape((m,1))))) / m + (regTerm / (2 * m)) * np.linalg.norm(theta[1:]) return J def gradient(X,y,theta,regTerm): (m,n) = X.shape […]

Trabajando con, preparando datos de bolsa de palabras para la Regresión

Estoy tratando de crear un modelo de regresión que predice la edad de los autores. Estoy usando (Nguyen et al, 2011) como mi base. Utilizando un Modelo de Bolsa de Palabras, cuento las ocurrencias de palabras por Documento (que son Publicaciones de Tableros) y creo el vector para cada Publicación. Limito el tamaño de cada […]

ValueError: un valor en x_new está por debajo del rango de interpolación

Este es un error de scikit-learn que recibo cuando lo hago. my_estimator = LassoLarsCV(fit_intercept=False, normalize=False, positive=True, max_n_alphas=1e5) Tenga en cuenta que si disminuyo max_n_alphas de 1e5 a 1e4, no volveré a aparecer este error. ¿Alguien tiene una idea de lo que está pasando? El error ocurre cuando llamo my_estimator.fit(x, y) Tengo 40k puntos de datos […]