Articles of logistic regression

Evaluación de regresión logística con validación cruzada.

Me gustaría usar la validación cruzada para probar / entrenar mi conjunto de datos y evaluar el rendimiento del modelo de regresión logística en todo el conjunto de datos y no solo en el conjunto de pruebas (por ejemplo, 25%). Estos conceptos son totalmente nuevos para mí y no estoy muy seguro de si lo […]

TensorFlow devolviendo nan al implementar regresión logística

He estado intentando implementar la Regresión logística en TensorFlow siguiendo el ejemplo de MNIST pero con datos de un CSV. Cada fila es una muestra y tiene 12 dimensiones. Mi código es el siguiente: batch_size = 5 learning_rate = .001 x = tf.placeholder(tf.float32,[None,12]) y = tf.placeholder(tf.float32,[None,2]) W = tf.Variable(tf.zeros([12,2])) b = tf.Variable(tf.zeros([2])) mult = tf.matmul(x,W) […]

Scikit Learn: Coeficientes del modelo de regresión logística: Aclaración

Necesito saber cómo devolver los coeficientes de regresión logística de tal manera que yo mismo pueda generar las probabilidades predichas. Mi código se ve así: lr = LogisticRegression() lr.fit(training_data, binary_labels) # Generate probabities automatically predicted_probs = lr.predict_proba(binary_labels) Había asumido que los valores de lr.coeff_ seguirían la regresión logística típica, de modo que podría devolver las […]

¿Por qué los resultados de la regresión logística son diferentes entre statsmodels y R?

Estoy tratando de comparar las implementaciones de regresión logística en los modelos de estadísticas de Python y R. Versión de Python: import statsmodels.api as sm import pandas as pd import pylab as pl import numpy as np df = pd.read_csv(“http://www.ats.ucla.edu/stat/data/binary.csv”) df.columns = list(df.columns)[:3] + [“prestige”] # df.hist() # pl.show() dummy_ranks = pd.get_dummies(df[“prestige”], prefix=”prestige”) cols_to_keep = […]

No se puede ejecutar la regresión logística debido al “error de separación perfecto”

Soy un principiante en el análisis de datos en Python y he tenido problemas con esta tarea en particular. He buscado bastante, pero no he podido identificar lo que está mal. Importé un archivo y lo configuré como un dataframe. Limpia los datos dentro del archivo. Sin embargo, cuando bash ajustar mi modelo a los […]

ValueError: Tipo de etiqueta desconocido: ‘desconocido’

Intento ejecutar el siguiente código. Por cierto, soy nuevo tanto en python como en sklearn. import pandas as pd import numpy as np from sklearn.linear_model import LogisticRegression # data import and preparation trainData = pd.read_csv(‘train.csv’) train = trainData.values testData = pd.read_csv(‘test.csv’) test = testData.values X = np.c_[train[:, 0], train[:, 2], train[:, 6:7], train[:, 9]] X […]

Por qué el auc es tan diferente de la regresión logística de sklearn y R

Utilizo un mismo conjunto de datos para entrenar el modelo de regresión logística tanto en R como en sklearn de python. El conjunto de datos está desequilibrado. Y me parece que el auc es bastante diferente. Este es el código de python: model_logistic = linear_model.LogisticRegression() #auc 0.623 model_logistic.fit(train_x, train_y) pred_logistic = model_logistic.predict(test_x) #mean:0.0235 var:0.023 print […]

Creación de una instancia sklearn.linear_model.LogisticRegression a partir de coeficientes existentes

¿Se puede crear una instancia de este tipo en función de los coeficientes existentes que se calcularon, por ejemplo, en una implementación diferente (por ejemplo, Java)? Intenté crear una instancia y luego establecer coef_ e intercept_ directamente y parece funcionar, pero no estoy seguro de si hay algún inconveniente aquí o si podría estar rompiendo […]

Logit multinomial de Python con el módulo statsmodels: Cambiar el valor base de la regresión de mlogit

Tengo un pequeño problema con el que estoy atascado. Estoy creando un modelo logit multinomial con modelos de estadísticas de Python y deseo reproducir un ejemplo dado en un libro de texto. Hasta ahora todo bien, pero estoy luchando para establecer un valor objective diferente como el valor base para la regresión. ¿Alguien puede ayudar? […]

Error al entrenar el modelo de regresión logística en Apache Spark. SPARK-5063

Estoy tratando de construir un modelo de regresión logística con Apache Spark. Aquí está el código. parsedData = raw_data.map(mapper) # mapper is a function that generates pair of label and feature vector as LabeledPoint object featureVectors = parsedData.map(lambda point: point.features) # get feature vectors from parsed data scaler = StandardScaler(True, True).fit(featureVectors) #this creates a standardization […]