Articles of logistic regression

La función de costo y el gradiente parecen estar funcionando, pero las funciones de scipy.optimize no están

Estoy trabajando con mi código de Matlab para el curso Andrew NG Coursera y convirtiéndolo en python. Estoy trabajando en una regresión logística no regularizada y, después de escribir mis funciones de gradiente y costo, necesitaba algo similar a Fminunc y, después de algunas búsquedas en Google, encontré un par de opciones. Ambos están devolviendo […]

Regresión Logit multinomial / condicional, ¿Por qué StatsModel falla en el ejemplo del paquete mlogit?

Estoy tratando de reproducir un ejemplo de una regresión logit multinomial del paquete mlogit en R. data(“Fishing”, package = “mlogit”) Fish <- mlogit.data(Fishing, varying = c(2:9), shape = "wide", choice = "mode") #a pure "conditional" model summary(mlogit(mode ~ price + catch, data = Fish)) Para reproducir este ejemplo con la función statsmodel MNLogit, exporto el […]

Python: cómo usar la regresión logística multinomial usando SKlearn

Tengo un conjunto de datos de prueba y un conjunto de datos de tren como se muestra a continuación. He proporcionado una muestra de datos con registros mínimos, pero mis datos tienen más de 1000 registros. Aquí E es mi variable objective que necesito predecir usando un algoritmo. Tiene solo cuatro categorías como 1,2,3,4. Solo […]

Python SKLearn: Probabilidades de regresión logística

Estoy utilizando el módulo SKLearn de Python para realizar una regresión logística. Tengo un vector variable dependiente Y (tomando valores de 1 de las clases M) y una matriz variable independiente X (con N características). Mi codigo es LR = LogisticRegression() LR.fit(X,np.resize(Y,(len(Y)))) Mi pregunta es, ¿ LR.intercept_ representan LR.coef_ y LR.intercept_ ? Inicialmente pensé que […]

¿Qué coeficientes van a qué clase en la regresión logística multiclase en scikit?

Estoy usando la Regresión logística de scikit learn para un problema multiclase. logit = LogisticRegression(penalty=’l1′) logit = logit.fit(X, y) Estoy interesado en qué características están impulsando esta decisión. logit.coef_ Lo anterior me da un hermoso dataframe en formato (n_classes, n_features) , pero todas las clases y nombres de características han desaparecido. Con las características, eso […]

Evaluación de regresión logística con validación cruzada.

Me gustaría usar la validación cruzada para probar / entrenar mi conjunto de datos y evaluar el rendimiento del modelo de regresión logística en todo el conjunto de datos y no solo en el conjunto de pruebas (por ejemplo, 25%). Estos conceptos son totalmente nuevos para mí y no estoy muy seguro de si lo […]

TensorFlow devolviendo nan al implementar regresión logística

He estado intentando implementar la Regresión logística en TensorFlow siguiendo el ejemplo de MNIST pero con datos de un CSV. Cada fila es una muestra y tiene 12 dimensiones. Mi código es el siguiente: batch_size = 5 learning_rate = .001 x = tf.placeholder(tf.float32,[None,12]) y = tf.placeholder(tf.float32,[None,2]) W = tf.Variable(tf.zeros([12,2])) b = tf.Variable(tf.zeros([2])) mult = tf.matmul(x,W) […]

Scikit Learn: Coeficientes del modelo de regresión logística: Aclaración

Necesito saber cómo devolver los coeficientes de regresión logística de tal manera que yo mismo pueda generar las probabilidades predichas. Mi código se ve así: lr = LogisticRegression() lr.fit(training_data, binary_labels) # Generate probabities automatically predicted_probs = lr.predict_proba(binary_labels) Había asumido que los valores de lr.coeff_ seguirían la regresión logística típica, de modo que podría devolver las […]

¿Por qué los resultados de la regresión logística son diferentes entre statsmodels y R?

Estoy tratando de comparar las implementaciones de regresión logística en los modelos de estadísticas de Python y R. Versión de Python: import statsmodels.api as sm import pandas as pd import pylab as pl import numpy as np df = pd.read_csv(“http://www.ats.ucla.edu/stat/data/binary.csv”) df.columns = list(df.columns)[:3] + [“prestige”] # df.hist() # pl.show() dummy_ranks = pd.get_dummies(df[“prestige”], prefix=”prestige”) cols_to_keep = […]

No se puede ejecutar la regresión logística debido al “error de separación perfecto”

Soy un principiante en el análisis de datos en Python y he tenido problemas con esta tarea en particular. He buscado bastante, pero no he podido identificar lo que está mal. Importé un archivo y lo configuré como un dataframe. Limpia los datos dentro del archivo. Sin embargo, cuando bash ajustar mi modelo a los […]