Articles of profundo

Múltiples sesiones y gráficas en Tensorflow (en el mismo proceso)

Estoy entrenando un modelo donde el vector de entrada es la salida de otro modelo. Esto implica restaurar el primer modelo desde un archivo de punto de control mientras se inicializa el segundo modelo desde cero (usando tf.initialize_variables() ) en el mismo proceso. Hay una cantidad sustancial de código y abstracción, así que simplemente estoy […]

¿Cómo definen las keras “exactitud” y “pérdida”?

No puedo encontrar cómo Keras define “exactitud” y “pérdida”. Sé que puedo especificar diferentes métricas (por ejemplo, mse, entropía cruzada), pero Keras imprime una “precisión” estándar. ¿Cómo se define eso? Del mismo modo para la pérdida: sé que puedo especificar diferentes tipos de regularización, ¿están aquellos en la pérdida? Idealmente, me gustaría imprimir la ecuación […]

¿Mi código de entrenamiento y validación (tensorflow) es correcto y el modelo se adapta?

Este es mi código: for it in range(EPOCH*24410//BATCH_SIZE): tr_pa, tr_sp = sess.run([tr_para, tr_spec]) train_loss, _ = sess.run([loss, fw_op], feed_dict={x: tr_pa, y: tr_sp}) train_loss_.append(train_loss) it_tr.append(it) va_pa, va_sp = sess.run([va_para, va_spec]) validate_loss = sess.run(loss, feed_dict={x: va_pa, y: va_sp}) validate_loss_.append(validate_loss) Esta es la pérdida de entrenamiento y la pérdida de validación: Mi pregunta es si mi código de […]

Incremento inesperado en el error de validación en MNIST Pytorch

Soy un poco nuevo en todo el campo y, por lo tanto, decidí trabajar en el conjunto de datos MNIST. Adapté prácticamente todo el código de https://github.com/pytorch/examples/blob/master/mnist/main.py , con solo un cambio significativo: Carga de datos. No quería usar el conjunto de datos precargado en Torchvision. Así que utilicé MNIST en CSV . Cargué los […]

Error de tamaño de cultivo en el modelo de caffe

Estoy tratando de entrenar un modelo de caffe. Me sale este error I0806 09:41:02.010442 2992 sgd_solver.cpp:105] Iteration 360, lr = 9.76e- 05 F0806 09:41:20.544955 2998 data_transformer.cpp:168] Check failed: height<=datum_height (224 vs. 199) *** Check failure stack trace: *** @ 0x7f82b051edaa (unknown) @ 0x7f82b051ece4 (unknown) @ 0x7f82b051e6e6 (unknown) @ 0x7f82b0521687 (unknown) @ 0x7f82b0b8e9e0 caffe::DataTransformer::Transform() @ 0x7f82b0c09a2f […]

Matriz de confusión de flujo tensor en TensorBoard

Quiero tener una matriz visual de confusión en tensorboard. Para hacer esto, estoy modificando el ejemplo de Evaluación de Tensorflow Slim: https://github.com/tensorflow/models/blob/master/slim/eval_image_classifier.py En este código de ejemplo, Accuracy ya se proporcionó, pero no es posible agregar la métrica de “matriz de confusión” directamente porque no se está transmitiendo. ¿Cuál es la diferencia entre las métricas […]

Api de detección de objetos TensorFlow: la clasificación de pesos se inicializa al cambiar el número de clases en el entrenamiento utilizando modelos pre-entrenados

Quiero utilizar no solo los pesos pre-entrenados del extractor de características, sino también los pesos pre-entrenados del clasificador / localización de las capas del mapa de características para el ajuste fino de los modelos de detección de objetos de flujo tensor (SSD) utilizando la API de detección de objetos de flujo tensor. Cuando mi nuevo […]

Ajuste de cotas de entrada Keras LSTM

Estaba tratando de entrenar un modelo LSTM usando keras, pero creo que me equivoqué aquí. Tengo un error de ValueError: Error al verificar la entrada: se esperaba que lstm_17_input tuviera 3 dimensiones, pero tenía una matriz con forma (10000, 0, 20) mientras mi código parece model = Sequential() model.add(LSTM(256, activation=”relu”, dropout=0.25, recurrent_dropout=0.25, input_shape=(None, 20, 64))) […]

¿Cómo entender el término `tensor` en TensorFlow?

Soy nuevo en TensorFlow. Mientras estoy leyendo la documentación existente, encontré el término tensor realmente confuso. Por eso, necesito aclarar las siguientes preguntas: ¿Cuál es la relación entre tensor y Variable , tensor vs. tf.constant , ‘tensor’ vs. tf.placeholder ? ¿Son todos los tipos de tensores?

¿Cómo escribir una capa de datos python caffe con precarga?

¿Cómo escribir una capa de datos asíncrona para precargar lotes mientras se realiza otro procesamiento? ¿Hay algunos códigos de ejemplo? Gracias