Articles of Machine Learning

Scikit Learn Multilabel Classification: ValueError: Parece que está usando una representación de datos de tags múltiples heredada

Estoy tratando de usar scikit learn 0.17 con anaconda 2.7 para un problema de clasificación de varias capas. aqui esta mi codigo import pandas as pd import pickle import re from sklearn.cross_validation import train_test_split from sklearn.metrics.metrics import classification_report, accuracy_score, confusion_matrix from nltk.stem import WordNetLemmatizer from sklearn.feature_extraction.text import TfidfVectorizer from sklearn.naive_bayes import MultinomialNB as MNB from […]

Uso de un clasificador de vectores de soporte con núcleo polinomial en scikit-learn

Estoy experimentando con diferentes clasificadores implementados en el paquete scikit-learn, para hacer alguna tarea de PNL. El código que utilizo para realizar la clasificación es el siguiente def train_classifier(self, argcands): # Extract the necessary features from the argument candidates train_argcands_feats = [] train_argcands_target = [] for argcand in argcands: train_argcands_feats.append(self.extract_features(argcand)) train_argcands_target.append(argcand[“info”][“label”]) # Transform the features […]

El algoritmo de propagación hacia atrás de la neural network no funciona en Python

Estoy escribiendo una neural network en Python, siguiendo el ejemplo aquí . Parece que el algoritmo de propagación hacia atrás no está funcionando, dado que la neural network no puede producir el valor correcto (dentro de un margen de error) después de haber sido entrenado 10 mil veces. Específicamente, lo estoy entrenando para calcular la […]

Cómo crear un algoritmo de descenso de gradiente simple

Estoy estudiando algoritmos simples de aprendizaje automático, comenzando con un simple descenso de gradiente, pero tengo algunos problemas para intentar implementarlo en Python. Aquí está el ejemplo que estoy tratando de reproducir, tengo datos sobre casas con (área de estar (en pies2) y número de habitaciones) con el precio resultante: Sala de estar (pies2): 2104 […]

Fusionar con múltiples matrices con diferentes dimensiones de columna

Para una tarea de aprendizaje automático, estoy buscando una manera de fusionar dos matrices de características, con diferentes dimensiones, para poder alimentarlas a un estimador. No puedo usar los métodos de fusión de scipy ya que estos requieren formas compatibles. Puedo usar los métodos de combinación de números, pero eso no funciona cuando realmente trato […]

Realización de convolución 1d usando kernel 2d en keras

Actualmente estoy trabajando en una red CNN, en la que quiero aplicar un kernel 2d en una imagen, pero solo tiene que realizar una convolución 1d, lo que significa que solo tiene que moverse a lo largo de un eje (eje x en este caso). La forma del kernel es la misma que la del […]

¿Cómo obtener el error de entrenamiento en svm de Scikit-learn?

Mi pregunta: ¿Cómo obtengo el error de entrenamiento en el módulo svm (clase SVC)? Estoy tratando de hacer una gráfica de error del conjunto del tren y del conjunto de prueba contra la cantidad de datos de entrenamiento utilizados (u otras características como C / gamma). Sin embargo, de acuerdo con la documentación de SVM […]

Precisión de la etiqueta individual multilabel multiclase de Keras

Estoy intentando realizar una clasificación multiclase multiclase con una CNN en Keras. He intentado crear una función de precisión de etiqueta individual basada en esta función a partir de una pregunta similar El código relevante que he intentado es: labels = [“dog”, “mammal”, “cat”, “fish”, “rock”] #I have more interesting_id = [0]*len(labels) interesting_id[labels.index(“rock”)] = 1 […]

Scikit-learn: error en el ajuste del modelo: la entrada contiene NaN, infinito o un valor demasiado grande para float64

Estoy usando Python scikit-learn para regresión lineal simple en datos obtenidos de csv. reader = pandas.io.parsers.read_csv(“data/all-stocks-cleaned.csv”) stock = np.array(reader) openingPrice = stock[:, 1] closingPrice = stock[:, 5] print((np.min(openingPrice))) print((np.min(closingPrice))) print((np.max(openingPrice))) print((np.max(closingPrice))) peningPriceTrain, openingPriceTest, closingPriceTrain, closingPriceTest = \ train_test_split(openingPrice, closingPrice, test_size=0.25, random_state=42) openingPriceTrain = np.reshape(openingPriceTrain,(openingPriceTrain.size,1)) openingPriceTrain = openingPriceTrain.astype(np.float64, copy=False) # openingPriceTrain = np.arange(openingPriceTrain, dtype=np.float64) closingPriceTrain = […]

tensorflow py_func es útil pero hace que mi entrenamiento sea muy lento.

Tengo algún problema de eficiencia al usar la función tensorflow py_func. Contexto En mi proyecto, tengo un lote de tensor input_features de tamaño [? max_items m] [? max_items m] . La primera dimensión se establece en ? porque es una forma dinámica (el lote se lee para un lector de flujo de tensión personalizado y […]