Articles of Machine Learning

Pandas (Python) – Actualizar la columna de un dataframe desde otro con condiciones

Tuve un problema y encontré una solución, pero creo que es la forma incorrecta de hacerlo. Tal vez, hay una manera más ‘canónica’ de hacerlo. Problema Tengo dos marcos de datos que me gustaría fusionar sin tener una columna adicional y sin borrar las informaciones existentes. Ejemplo: Marco de datos existente (df) A A2 B […]

Usando scikit-learn (sklearn), ¿cómo manejar los datos faltantes para la regresión lineal?

Intenté esto, pero no pude hacer que funcionara para mis datos: uso de Scikit Learn para hacer regresión lineal en un dataframe de pandas de series de tiempo Mis datos constan de 2 DataFrames. DataFrame_1.shape = (40,5000) y DataFrame_2.shape = (40,74) . Estoy tratando de hacer algún tipo de regresión lineal, pero DataFrame_2 contiene valores […]

Problemas con ANN BackProp / Gradient Checking.

Acabo de escribir mi primera clase de neural network en python. Todo lo que puedo decir debería funcionar, pero hay un error que parece que no puedo encontrar (Probablemente me está mirando a la cara). Primero lo probé con 10,000 ejemplos de datos MNIST, luego otra vez cuando intenté replicar la función de signo, y […]

Canalización “paralela” para obtener el mejor modelo utilizando gridsearch

En sklearn, se puede definir una tubería en serie para obtener la mejor combinación de hiperparámetros para todas las partes consecutivas de la tubería. Una tubería en serie se puede implementar de la siguiente manera: from sklearn.svm import SVC from sklearn import decomposition, datasets from sklearn.pipeline import Pipeline from sklearn.model_selection import GridSearchCV digits = datasets.load_digits() […]

Aplique el entrenamiento HOG + SVM a la cámara web para la detección de objetos

He entrenado a mi clasificador SVM extrayendo características HOG de un conjunto de datos positivo y negativo from sklearn.svm import SVC import cv2 import numpy as np hog = cv2.HOGDescriptor() def hoggify(x,z): data=[] for i in range(1,int(z)): image = cv2.imread(“/Users/munirmalik/cvprojek/cod/”+x+”/”+”file”+str(i)+”.jpg”, 0) dim = 128 img = cv2.resize(image, (dim,dim), interpolation = cv2.INTER_AREA) img = hog.compute(img) img […]

Python NLTK pos_tag no devuelve la etiqueta de parte de discurso correcta

Teniendo esto: text = word_tokenize(“The quick brown fox jumps over the lazy dog”) Y corriendo: nltk.pos_tag(text) Yo obtengo: [(‘The’, ‘DT’), (‘quick’, ‘NN’), (‘brown’, ‘NN’), (‘fox’, ‘NN’), (‘jumps’, ‘NNS’), (‘over’, ‘IN’), (‘the’, ‘DT’), (‘lazy’, ‘NN’), (‘dog’, ‘NN’)] Esto es incorrecto. Las tags para quick brown lazy en la oración deben ser: (‘quick’, ‘JJ’), (‘brown’, ‘JJ’) , […]

¿Entendiendo DictVectorizer en scikit-learn?

Estoy explorando las diferentes clases de extracción de características que proporciona scikit-learn. Leyendo la documentación que no entendí muy bien para saber qué DictVectorizer se puede usar. Otras preguntas vienen a la mente, por ejemplo, ¿cómo se puede usar DictVectorizer para la clasificación de texto ?, es decir, ¿cómo podría esta clase ayudar a manejar […]

Identificación de múltiples categorías y sentimiento asociado dentro del texto

Si tiene un corpus de texto, ¿cómo puede identificar todas las categorías (de una lista de categorías predefinidas) y el sentimiento asociado (escritura positiva / negativa) con él? Haré esto en Python, pero en esta etapa no estoy necesariamente buscando una solución específica para cada idioma. Veamos esta pregunta con un ejemplo para intentar aclarar […]

ValueError: `decode_predictions` espera un lote de predicciones (es decir, una matriz 2D de formas (muestras, 1000)). Arreglo encontrado con forma: (1, 7)

Estoy usando VGG16 con keras para la transferencia de aprendizaje (tengo 7 clases en mi nuevo modelo) y como tal quiero usar el método de predicción y predicción incorporado para generar las predicciones de mi modelo. Sin embargo, utilizando el siguiente código: preds = model.predict(img) decode_predictions(preds, top=3)[0] Recibo el siguiente mensaje de error: ValueError: decode_predictions […]

¿Cómo convierto un Dataloader de Pytorch en una matriz numpy para mostrar datos de imágenes con matplotlib?

Soy nuevo en Pytorch. He estado tratando de aprender cómo ver mis imágenes de entrada antes de comenzar a entrenar en mi CNN. Me está costando mucho cambiar las imágenes a una forma que se puede usar con matplotlib. Hasta ahora he intentado esto: from multiprocessing import freeze_support import torch from torch import nn import […]