Articles of logistic regression

Python SKLearn: Probabilidades de regresión logística

Estoy utilizando el módulo SKLearn de Python para realizar una regresión logística. Tengo un vector variable dependiente Y (tomando valores de 1 de las clases M) y una matriz variable independiente X (con N características). Mi codigo es LR = LogisticRegression() LR.fit(X,np.resize(Y,(len(Y)))) Mi pregunta es, ¿ LR.intercept_ representan LR.coef_ y LR.intercept_ ? Inicialmente pensé que […]

¿Qué coeficientes van a qué clase en la regresión logística multiclase en scikit?

Estoy usando la Regresión logística de scikit learn para un problema multiclase. logit = LogisticRegression(penalty=’l1′) logit = logit.fit(X, y) Estoy interesado en qué características están impulsando esta decisión. logit.coef_ Lo anterior me da un hermoso dataframe en formato (n_classes, n_features) , pero todas las clases y nombres de características han desaparecido. Con las características, eso […]

Evaluación de regresión logística con validación cruzada.

Me gustaría usar la validación cruzada para probar / entrenar mi conjunto de datos y evaluar el rendimiento del modelo de regresión logística en todo el conjunto de datos y no solo en el conjunto de pruebas (por ejemplo, 25%). Estos conceptos son totalmente nuevos para mí y no estoy muy seguro de si lo […]

TensorFlow devolviendo nan al implementar regresión logística

He estado intentando implementar la Regresión logística en TensorFlow siguiendo el ejemplo de MNIST pero con datos de un CSV. Cada fila es una muestra y tiene 12 dimensiones. Mi código es el siguiente: batch_size = 5 learning_rate = .001 x = tf.placeholder(tf.float32,[None,12]) y = tf.placeholder(tf.float32,[None,2]) W = tf.Variable(tf.zeros([12,2])) b = tf.Variable(tf.zeros([2])) mult = tf.matmul(x,W) […]

Scikit Learn: Coeficientes del modelo de regresión logística: Aclaración

Necesito saber cómo devolver los coeficientes de regresión logística de tal manera que yo mismo pueda generar las probabilidades predichas. Mi código se ve así: lr = LogisticRegression() lr.fit(training_data, binary_labels) # Generate probabities automatically predicted_probs = lr.predict_proba(binary_labels) Había asumido que los valores de lr.coeff_ seguirían la regresión logística típica, de modo que podría devolver las […]

¿Por qué los resultados de la regresión logística son diferentes entre statsmodels y R?

Estoy tratando de comparar las implementaciones de regresión logística en los modelos de estadísticas de Python y R. Versión de Python: import statsmodels.api as sm import pandas as pd import pylab as pl import numpy as np df = pd.read_csv(“http://www.ats.ucla.edu/stat/data/binary.csv”) df.columns = list(df.columns)[:3] + [“prestige”] # df.hist() # pl.show() dummy_ranks = pd.get_dummies(df[“prestige”], prefix=”prestige”) cols_to_keep = […]

No se puede ejecutar la regresión logística debido al “error de separación perfecto”

Soy un principiante en el análisis de datos en Python y he tenido problemas con esta tarea en particular. He buscado bastante, pero no he podido identificar lo que está mal. Importé un archivo y lo configuré como un dataframe. Limpia los datos dentro del archivo. Sin embargo, cuando bash ajustar mi modelo a los […]

ValueError: Tipo de etiqueta desconocido: ‘desconocido’

Intento ejecutar el siguiente código. Por cierto, soy nuevo tanto en python como en sklearn. import pandas as pd import numpy as np from sklearn.linear_model import LogisticRegression # data import and preparation trainData = pd.read_csv(‘train.csv’) train = trainData.values testData = pd.read_csv(‘test.csv’) test = testData.values X = np.c_[train[:, 0], train[:, 2], train[:, 6:7], train[:, 9]] X […]

Por qué el auc es tan diferente de la regresión logística de sklearn y R

Utilizo un mismo conjunto de datos para entrenar el modelo de regresión logística tanto en R como en sklearn de python. El conjunto de datos está desequilibrado. Y me parece que el auc es bastante diferente. Este es el código de python: model_logistic = linear_model.LogisticRegression() #auc 0.623 model_logistic.fit(train_x, train_y) pred_logistic = model_logistic.predict(test_x) #mean:0.0235 var:0.023 print […]

Creación de una instancia sklearn.linear_model.LogisticRegression a partir de coeficientes existentes

¿Se puede crear una instancia de este tipo en función de los coeficientes existentes que se calcularon, por ejemplo, en una implementación diferente (por ejemplo, Java)? Intenté crear una instancia y luego establecer coef_ e intercept_ directamente y parece funcionar, pero no estoy seguro de si hay algún inconveniente aquí o si podría estar rompiendo […]