Articles of rnn

PyTorch: pasando una matriz numpy para inicializar el peso

Me gustaría inicializar los parámetros de RNN con np arrays. En el siguiente ejemplo, quiero pasar w a los parámetros de rnn . Sé que pytorch proporciona muchos métodos de inicialización como Xavier, uniforme, etc., pero ¿hay alguna manera de inicializar los parámetros pasando matrices de números? import numpy as np import torch as nn […]

¿Cómo construir una capa de incrustación en Tensorflow RNN?

Estoy construyendo una red RNN LSTM para clasificar los textos según la edad de los escritores (clasificación binaria – joven / adulto). Parece que la red no aprende y de repente comienza a sobrecalentar: Rojo: tren Azul: validación Una posibilidad podría ser que la representación de los datos no sea lo suficientemente buena. Acabo de […]

tensorflow static_rnn error: la entrada debe ser una secuencia

Estoy tratando de alimentar mis propios datos 3D a un LSTM. Los datos tienen: altura = 365, ancho = 310, tiempo = desconocido / inconsistente, constan de 0 y 1, cada bloque de datos que produce una salida se separa en un solo archivo. import tensorflow as tf import os from tensorflow.contrib import rnn filename […]

Variables internas en BasicRNNCell

Tengo el siguiente código de ejemplo para probar BasicRNNCell . Me gustaría obtener su matriz interna para poder calcular los valores de output_res , newstate_res usando mi propio código para asegurarme de que puedo reproducir los valores de output_res , newstate_res . En el código fuente de tensorflow, dice output = new_state = act(W * […]

¿Arquitectura LSTM en la implementación de Keras?

Soy nuevo en Keras y estoy revisando la LSTM y sus detalles de implementación en la Keras documentation . Fue fácil, pero de repente pasé por esta publicación de SO y el comentario. Me ha confundido en lo que es la architecture LSTM real: Aquí está el código: model = Sequential() model.add(LSTM(32, input_shape=(10, 64))) model.add(Dense(2)) […]

Tensorflow guarda el estado final de LSTM en dynamic_rnn para la predicción

Quiero guardar el estado final de mi LSTM para que se incluya cuando restauro el modelo y se puede usar para la predicción. Como se explica a continuación, el ahorrador solo tiene conocimiento del estado final cuando uso tf.assign . Sin embargo, esto produce un error (también se explica a continuación). Durante el entrenamiento, siempre […]