Articles of Neural Network

La red de Caffe tiene muy poca pérdida pero muy mala precisión en las pruebas

Soy algo nuevo para caffe, y estoy teniendo un comportamiento extraño. Estoy tratando de usar el ajuste fino en el bvlc_reference_caffenet para realizar una tarea OCR. Tomé su red pre-entrenada, cambié la última capa de FC al número de clases de salida que tengo, y la reentrené. Después de unas pocas miles de iteraciones, obtengo […]

Biblioteca neurolab entrenamiento newff

Soy bastante nuevo en el uso de python y neurolab y tengo un problema con el entrenamiento de mi neural network de alimentación. He construido la red de la siguiente manera: net = nl.net.newff([[-1,1]]*64, [60,1]) net.init() testerr = net.train(InputT, TargetT, epochs=100, show=1) y mi salida de destino es un vector entre 0 y 4. Cuando […]

Obtener pesos del modelo tensorflow

Hola, me gustaría ajustar el modelo VGG desde tensorflow. Tengo dos preguntas. ¿Cómo obtener los pesos de la red? Las variables trainable_variables devuelven la lista vacía para mí. Usé el modelo existente desde aquí: https://github.com/ry/tensorflow-vgg16 . Encuentro la publicación sobre cómo obtener pesos, sin embargo, esto no funciona para mí debido a import_graph_def. Obtenga el […]

Cómo entrenar nuevas imágenes rápidas rcnn

Estoy usando fast-rcnn e bash entrenar al sistema para la nueva clase (etiqueta). Seguí esto: https://github.com/EdisonResearch/fast-rcnn/tree/master/help/train Colocó las imágenes Colocó las anotaciones Prepare el ImageSet con todo el prefijo del nombre de la imagen Salida de búsqueda selectiva preparada: train.mat Fallé al ejecutar train_net.py con el siguiente error: ./tools/train_net.py –gpu 0 –solver models/VGG_1024_pascal2007/solver.prototxt –imdb voc_2007_train_top_5000 […]

Cómo estructurar una neural network LSTM para clasificación

Tengo datos que tienen varias conversaciones entre dos personas. Cada oración tiene algún tipo de clasificación. Estoy intentando usar una red de PNL para clasificar cada oración de la conversación. Probé una red de convolución y obtuve resultados decentes (aunque no pioneros). Me di cuenta de que, dado que se trata de una conversación de […]

Función entropía cruzada (python)

Estoy aprendiendo la neural network y quiero escribir una función cross_entropy en python. Donde se define como donde N es el número de muestras, k es el número de clases, log es el logaritmo natural, t_i,j es 1 si la muestra i está en la clase j y 0 contrario, y p_i,j es la probabilidad […]

Error al utilizar Conv2DLayer con lasaña NeuralNet

Tengo Windows 8.1 64bit y uso recomendado aquí http://deeplearning.net/software/theano/install_windows.html#installing-theano python win-python distribution (python 3.4). He seguido todos los pasos del tutorial (excluyendo CUDA y GPU config), desinstalé todo y lo hice de nuevo, pero mi problema persiste. Estoy tratando de construir una neural network convolucional utilizando lasaña. Todas las capas que he probado hasta ahora […]

Creando muchas columnas de características en Tensorflow

Me estoy iniciando en un proyecto Tensorflow, y estoy en medio de definir y crear mis columnas de características. Sin embargo, tengo cientos y cientos de características, es un conjunto de datos bastante extenso. Incluso después de preprocesar y fregar, tengo muchas columnas. La forma tradicional de crear una feature_column se define en el tutorial […]

Keras GRU NN KeyError al realizar la instalación: “no está en el índice”

Actualmente estoy enfrentando un problema al intentar adaptar mi modelo de GRU a mis datos de entrenamiento. Después de echar un vistazo rápido a StackOverflow, encontré que esta publicación era bastante similar a mi problema: Entrenamiento de Lstm más simple con Keras io. Mi propio modelo es el siguiente: nn = Sequential() nn.add(Embedding(input_size, hidden_size)) nn.add(GRU(hidden_size_2, […]

Cuadro de importancia de la característica en la neural network utilizando Keras en Python

Estoy usando spyware python (3.6) anaconda (64 bit) (3.1.2). Ya configuré un modelo de neural network utilizando keras (2.0.6) para un problema de regresión (una respuesta, 10 variables). Me preguntaba cómo puedo generar una tabla de importancia de características como tal: def base_model(): model = Sequential() model.add(Dense(200, input_dim=10, kernel_initializer=’normal’, activation=’relu’)) model.add(Dense(1, kernel_initializer=’normal’)) model.compile(loss=’mean_squared_error’, optimizer = […]