Articles of Neural Network

Predicción de la siguiente palabra usando el ejemplo del modelo de lenguaje tensorflow

El tutorial tensorflow sobre el modelo de lenguaje permite calcular la probabilidad de oraciones: probabilities = tf.nn.softmax(logits) en los comentarios a continuación, también especifica una forma de predecir la siguiente palabra en lugar de las probabilidades, pero no especifica cómo se puede hacer esto. Entonces, ¿cómo generar una palabra en lugar de una probabilidad usando […]

Aprendizaje profundo – una serie de preguntas ingenuas sobre caffe

Estoy tratando de entender los conceptos básicos de caffe, en particular para usar con python. Tengo entendido que la definición del modelo (por ejemplo, una architecture de neural network dada) debe incluirse en el archivo ‘.prototxt’ . Y que cuando entrena el modelo en los datos usando ‘.prototxt’ , guarda los parámetros de peso / […]

¿Cómo extraer pesos de sesgo en el modelo secuencial de Keras?

Estoy ejecutando una red de alimentación directa simple utilizando Keras . Teniendo solo una capa oculta, me gustaría hacer una inferencia con respecto a la relevancia de cada entrada para cada salida y me gustaría extraer los pesos. Este es el modelo: def build_model(input_dim, output_dim): n_output_layer_1 = 150 n_output = output_dim model = Sequential() model.add(Dense(n_output_layer_1, […]

Caffe: ¿cómo obtener la fase de una capa de Python?

“myLayer” capa “Python” “myLayer” en caffe, y la uso en la red train_val.prototxt Inserto la capa de esta manera: layer { name: “my_py_layer” type: “Python” bottom: “in” top: “out” python_param { module: “my_module_name” layer: “myLayer” } include { phase: TRAIN } # THIS IS THE TRICKY PART! } Ahora, mi capa solo participa en la […]

¿Cómo puedo ejecutar un bucle con un tensor como su rango? (en tensorflow)

Quiero tener un bucle for que el número de sus iteraciones depende de un valor de tensor. Por ejemplo: for i in tf.range(input_placeholder[1,1]): # do something Sin embargo me sale el siguiente error: “TypeError: el objeto ‘Tensor’ no es iterable” ¿Qué tengo que hacer?

¿Cuál es el papel de la capa TimeDistributed en Keras?

Estoy tratando de entender lo que hace el envoltorio TimeDistributed en Keras. Obtengo que TimeDistributed “aplica una capa a cada segmento temporal de una entrada”. Pero hice algunos experimentos y obtuve los resultados que no puedo entender. En resumen, en relación con la capa LSTM, TimeDistributed y solo la capa Densa tienen los mismos resultados. […]

¿Cómo trabajar con múltiples entradas para LSTM en Keras?

Estoy tratando de predecir el uso de agua de una población. Tengo 1 entrada principal: Volumen de agua y 2 entradas secundarias: Temperatura Lluvia En teoría tienen una relación con el abastecimiento de agua. Hay que decir que los datos de cada lluvia y temperatura corresponden al volumen de agua. Así que este es un […]

Secuencias de eventos, redes neuronales recurrentes, PyBrain

Estoy tratando de predecir la demanda de ventas utilizando redes neuronales recurrentes. aquí https://stackoverflow.com/a/2525149/423805 Se mencionó que las secuencias son compatibles con PyBrain con código de ejemplo. A pesar de que los datos no son exactamente categorías, los modelé como tales para este ejemplo. Los datos están aquí 6 6 6 6 2 6 2 […]

¿Por qué la neural network simple de 2 capas no puede aprender la secuencia 0,0?

Al pasar por el ejemplo de una pequeña neural network de 2 capas, noté el resultado que no puedo explicar. Imagina que tenemos el siguiente conjunto de datos con las tags correspondientes: [0,1] -> [0] [0,1] -> [0] [1,0] -> [1] [1,0] -> [1] Vamos a crear una pequeña NN de 2 capas que aprenderá […]

Fusionar 2 modelos secuenciales en Keras.

Estoy intentando fusionar 2 modelos secuenciales en keras. Aquí está el código: model1 = Sequential(layers=[ # input layers and convolutional layers Conv1D(128, kernel_size=12, strides=4, padding=’valid’, activation=’relu’, input_shape=input_shape), MaxPooling1D(pool_size=6), Conv1D(256, kernel_size=12, strides=4, padding=’valid’, activation=’relu’), MaxPooling1D(pool_size=6), Dropout(.5), ]) model2 = Sequential(layers=[ # input layers and convolutional layers Conv1D(128, kernel_size=20, strides=5, padding=’valid’, activation=’relu’, input_shape=input_shape), MaxPooling1D(pool_size=5), Conv1D(256, kernel_size=20, strides=5, […]