Articles of scikit learn

ValueError: los datos no son binarios y no se especifica pos_label

Estoy intentando calcular roc_auc_score , pero roc_auc_score siguiente error. “ValueError: Data is not binary and pos_label is not specified” Mi fragmento de código es el siguiente: import numpy as np from sklearn.metrics import roc_auc_score y_scores=np.array([ 0.63, 0.53, 0.36, 0.02, 0.70 ,1 , 0.48, 0.46, 0.57]) y_true=np.array([‘0’, ‘1’, ‘0’, ‘0’, ‘1’, ‘1’, ‘1’, ‘1’, ‘1’]) roc_auc_score(y_true, […]

Encontrar frases inusuales utilizando una “bolsa de frases habituales”

Mi objective es introducir una serie de frases como en array = [“Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua.”,”At vero eos et accusam et justo duo dolores et ea rebum.”,”Stet clita kasd gubergren, no sea takimata sanctus est […]

Cómo reformatear variables categóricas de Pandas para Sci-kit Learn

Dado un dataframe pandas que se parece a esto: | | c_0337 | c_0348 | c_0351 | c_0364 | |——-|:——:|——-:|——–|——–| | id | | | | | | 11193 | a | f | o | a | | 11382 | a | k | s | a | | 16531 | b | p […]

Extracción de componentes de PCA con sklearn.

Estoy utilizando la PCA de sklearn para reducir la dimensionalidad en un gran conjunto de imágenes. Una vez que se instale la PCA, me gustaría ver cómo se ven los componentes. Uno puede hacerlo mirando el atributo components_ . Sin darme cuenta de que estaba disponible, hice algo más en su lugar: each_component = np.eye(total_components) […]

Error al intentar instalar sklearn desde Pycharm | arrayobject.h no puede ser absoluto

Declaración de error completa: ValueError: la ruta ‘/home/andy/anaconda3/lib/python3.5/sitepackages/numpy/core/include/numpy/arrayobject.h’ no puede ser absoluta He instalado la versión Scipy y numpy (mkl) descargando los archivos de la rueda comstackdos desde este enlace y luego instalándolos desde el cmd usando pip . Soy más de un Python Noob, mi enfoque es principalmente el aprendizaje automático. Por favor ayúdame.

¿Cómo combinar las salidas de múltiples clasificadores bayes naive?

Soy nuevo en esto. Tengo un conjunto de clasificadores débiles construidos utilizando Naive Bayes Classifier (NBC) en el kit de herramientas Sklearn. Mi problema es cómo combino la salida de cada uno de los NBC para tomar una decisión final. Quiero que mi decisión esté en probabilidades y no en tags. Realicé el siguiente progtwig […]

¿Cuál es una buena manera de obtener una medida de similitud de dos imágenes que contienen un gráfico de líneas?

He probado el algoritmo dHash que se aplica en cada imagen, luego se calcula una distancia de hamming en ambos hashes, cuanto menor sea el número, mayor será la similitud. from PIL import Image import os import shutil import glob from plotData import * def hamming_distance(s1, s2): #Return the Hamming distance between equal-length sequences if […]

Scikit NaN o mensaje de error infinito

Estoy importando algunos datos de un archivo csv. El archivo tiene valores nan marcados con el texto ‘NA’. Importe los datos con: X = genfromtxt(data, delimiter=’,’, dtype=float, skip_header=1) Utilizo este código para reemplazar nan por una media de columna calculada previamente. inds = np.where(np.isnan(X)) X[inds]=np.take(col_mean,inds[1]) Luego ejecuto un par de cheques y obtengo matrices vacías: […]

¿Cómo hacer pd.get_dummies u otras formas?

En realidad, mi problema se basa en: ¿Existe una manera más rápida de actualizar los valores de la columna del dataframe según las condiciones? Por lo tanto, los datos deben ser: import pandas as pd import io t=””” AV4MdG6Ihowv-SKBN_nB DTP,FOOD AV4Mc2vNhowv-SKBN_Rn Cash 1,FOOD AV4MeisikOpWpLdepWy6 DTP,Bar AV4MeRh6howv-SKBOBOn Cash 1,FOOD AV4Mezwchowv-SKBOB_S DTOT,Bar AV4MeB7yhowv-SKBOA5b DTP,Bar “”” data_vec=pd.read_csv(io.StringIO(t),sep=’\s{2,}’,names=[‘id’,’source’]) data_vec […]

Cómo hacer que Keras Neural Net supere a la regresión logística en datos Iris

Estoy comparando Keras Neural-Net con una simple Regresión logística de Scikit-learn sobre datos de IRIS. Espero que Keras-NN se desempeñe mejor, como lo sugiere esta publicación . Pero ¿por qué al imitar el código allí, el resultado de Keras-NN es más bajo que la regresión logística? import seaborn as sns import numpy as np from […]