Articles of lstm

La falta de coincidencia de la dimensión en LSTM Keras

Quiero crear un RNN básico que pueda agregar dos bytes. Aquí están las entradas y salidas, que se esperan de una adición simple X = [[0, 0], [0, 1], [1, 1], [0, 1], [1, 0], [1, 0], [1, 1], [1, 0]] Es decir, X1 = 00101111 y X2 = 01110010 Y = [1, 0, 1, […]

Python explica cómo cambiar el tamaño de la entrada después de la capa de convolución en la capa lstm

Tengo un problema con la conexión entre la capa de convolución y la capa lstm. Los datos tienen una forma (75,5) donde hay 75 pasos de tiempo x 5 puntos de datos para cada paso de tiempo. Lo que quiero hacer es hacer una convolución en (75×5), obtener nuevos datos convueltos (75×5) y alimentar esos […]

Tensor Flow – LSTM – Objeto ‘Tensor’ no iterable

Hola, estoy usando la siguiente función para lstm rnn cell. def LSTM_RNN(_X, _istate, _weights, _biases): # Function returns a tensorflow LSTM (RNN) artificial neural network from given parameters. # Note, some code of this notebook is inspired from an slightly different # RNN architecture used on another dataset: # https://tensorhub.com/aymericdamien/tensorflow-rnn # (NOTE: This step could […]

Use keras (TensorFlow) para construir un modelo Conv2D + LSTM

Los datos son 10 videos y cada video se divide en 86 cuadros y cada cuadro tiene 28 * 28 píxeles, video_num = 10 frame_num = 86 pixel_num = 28*28 Quiero usar Conv2D + LSDM para construir el modelo, y en cada time_steps (= frame_num = 86) enviar los datos de píxeles (= INPUT_SIZE = […]

Keras – Restaura el estado oculto de LSTM para una marca de tiempo específica

Esta pregunta está en continuar con ( LSTM – Hacer predicciones en una secuencia parcial ). Como se describió en la pregunta anterior, he entrenado un modelo LSTM con estado para la clasificación binaria con lotes de 100 muestras / tags, así: [Feature 1,Feature 2, …. ,Feature 3][Label 1] [Feature 1,Feature 2, …. ,Feature 3][Label […]

¿En qué orden se guardan los pesos en un kernel LSTM en Tensorflow?

Busqué en los pesos guardados para una LSTMCell en Tensorflow. Tiene un kernel grande y pesos de polarización. Las dimensiones del núcleo son. (input_size + hidden_size)*(hidden_size*4) Ahora, por lo que entiendo, esto es encapsular 4 entradas a transformaciones afines de capa oculta, así como 4 transformaciones de capa oculta a oculta. Entonces debería haber 4 […]

Keras LSTM: datos de secuencia de alimentación con el conjunto de datos Tensorflow API desde el generador

Estoy tratando de resolver cómo puedo enviar datos a mi modelo LSTM para la capacitación. (Simplificaré el problema en mi ejemplo a continuación). Tengo el siguiente formato de datos en archivos csv en mi conjunto de datos. Timestep Feature1 Feature2 Feature3 Feature4 Output 1 1 2 3 4 a 2 5 6 7 8 b […]

Keras – Nan en resumen histogtwig LSTM

He escrito un modelo LSTM utilizando Keras y utilizando la activación avanzada de LeakyReLU: # ADAM Optimizer with learning rate decay opt = optimizers.Adam(lr=0.0001, beta_1=0.9, beta_2=0.999, epsilon=1e-08, decay=0.0001) # build the model model = Sequential() num_features = data.shape[2] num_samples = data.shape[1] model.add( LSTM(16, batch_input_shape=(None, num_samples, num_features), return_sequences=True, activation=’linear’)) model.add(LeakyReLU(alpha=.001)) model.add(Dropout(0.1)) model.add(LSTM(8, return_sequences=True, activation=’linear’)) model.add(Dropout(0.1)) model.add(LeakyReLU(alpha=.001)) […]

¿Cuál es la architecture detrás de la implementación de la capa Keras LSTM?

¿Cómo se convierten las dimensiones de entrada a las dimensiones de salida para la capa LSTM en Keras? Al leer la publicación del blog de Colah, parece que el número de “timesteps” (también conocido como input_dim o el primer valor en input_shape ) debe ser igual al número de neuronas, que debe ser igual al […]

Tensorflow: uso de pesas entrenadas en un modelo dentro de otro, modelo diferente

Estoy tratando de entrenar un LSTM en Tensorflow utilizando minibatches, pero una vez finalizado el entrenamiento, me gustaría usar el modelo enviando un ejemplo a la vez. Puedo configurar el gráfico dentro de Tensorflow para entrenar mi red LSTM, pero luego no puedo usar el resultado entrenado de la manera que quiero. El código de […]