Articles of Learning

¿Cómo obtener mini-lotes en pytorch de forma limpia y eficiente?

Estaba tratando de hacer una cosa simple que era entrenar un modelo lineal con Estocástica Gradiente Descenso (SGD) utilizando antorcha: import numpy as np import torch from torch.autograd import Variable import pdb def get_batch2(X,Y,M,dtype): X,Y = X.data.numpy(), Y.data.numpy() N = len(Y) valid_indices = np.array( range(N) ) batch_indices = np.random.choice(valid_indices,size=M,replace=False) batch_xs = torch.FloatTensor(X[batch_indices,:]).type(dtype) batch_ys = torch.FloatTensor(Y[batch_indices]).type(dtype) […]

TypeError: el argumento write () debe ser str, no bytes mientras se guarda el archivo .npy

Intenté ejecutar el código en un blog de Keras. El código se escribe en un archivo .npy de la siguiente manera: bottleneck_features_train = model.predict_generator(generator, nb_train_samples // batch_size) np.save(open(‘bottleneck_features_train.npy’, ‘w’),bottleneck_features_train) Luego lee de este archivo: def train_top_model(): train_data = np.load(open(‘bottleneck_features_train.npy’)) Ahora me sale un error diciendo: Found 2000 images belonging to 2 classes. Traceback (most recent […]

¿Cómo puedo usar una neural network pre-entrenada con imágenes en escala de grises?

Tengo un conjunto de datos que contiene imágenes en escala de grises y quiero entrenar a una CNN de vanguardia sobre ellas. Me gustaría mucho afinar un modelo pre-entrenado (como los de aquí ). El problema es que casi todos los modelos para los que puedo encontrar los pesos han sido entrenados en el conjunto […]

¿Hay una manera buena y fácil de visualizar datos de alta dimensión?

¿Alguien puede decirme si hay una forma buena (fácil) de visualizar datos de alta dimensión? Mis datos tienen actualmente 21 dimensiones, pero me gustaría ver si son densos o dispersos. ¿Existen técnicas para lograrlo?

¿Cómo entrenar Word2vec en conjuntos de datos muy grandes?

Estoy pensando en entrenar word2vec en datos a gran escala de más de 10 TB + de tamaño en el volcado de rastreo web. Personalmente entrené la implementación de GoogleNews-2012 dump (1.5 gb) en mi iMac, me tomó aproximadamente 3 horas entrenar y generar vectores (impresionados por la velocidad). Sin embargo, no probé la implementación […]

¿Por qué obtengo AttributeError: el objeto ‘KerasClassifier’ no tiene ningún atributo ‘modelo’?

Este es el código y solo aparece el error en la última línea, que es y_pred = classifier.predict(X_test) . El error que AttributeError: ‘KerasClassifier’ object has no attribute ‘model’ es AttributeError: ‘KerasClassifier’ object has no attribute ‘model’ # Importing the libraries import numpy as np import matplotlib.pyplot as plt import pandas as pd from sklearn […]

Cómo instalar la versión de tensorflow GPU en VirtualBox Ubuntu OS. Y el sistema operativo host es Windows 10

Quiero configurar el entorno para el aprendizaje profundo utilizando Anaconda (python 3.6). Tengo un sistema que tiene nvidia get force 1060 con ventanas instaladas en él. Ahora quiero tener Ubuntu OS en VB. ¿Puedo instalar las bibliotecas Cuda y CuDNN en el sistema operativo Ubuntu basado en VB? ¿Alguien que pueda ayudarme?

entrenando un modelo keras multi-salida

Tengo 10.000 imágenes, cada una de las cuales está etiquetada con 20 tags. Para cada imagen, la etiqueta es verdadera o falsa. Estoy tratando de entrenar un modelo de múltiples salidas para realizar todas estas 20 clasificaciones binarias con una red. La red es una red residual. Después de la capa plana, la red se […]

¿Puedo boost imágenes y máscaras en Keras usando solo flow () en lugar de flow_from_directory?

He estado tratando de entrenar una CNN utilizando Keras con aumento de datos aplicado a una serie de imágenes y sus máscaras de segmentación. El ejemplo en línea dice que para hacer esto, debería crear dos generadores separados usando flow_from_directory () y luego comprimirlos. Pero en cambio, ¿puedo simplemente tener dos matrices numpy para las […]

¿Arquitectura LSTM en la implementación de Keras?

Soy nuevo en Keras y estoy revisando la LSTM y sus detalles de implementación en la Keras documentation . Fue fácil, pero de repente pasé por esta publicación de SO y el comentario. Me ha confundido en lo que es la architecture LSTM real: Aquí está el código: model = Sequential() model.add(LSTM(32, input_shape=(10, 64))) model.add(Dense(2)) […]