Articles of aprendizaje automático

Diferencia entre Keras model.fit usando solo batch_size y usando solo steps_per_epoch

Cuando ejecuto model.fit utilizando los parámetros batch_size y steps_per_epoch, recibo el siguiente error: ValueError: If steps_per_epoch is set, the `batch_size` must be None. Entonces, a partir de este error y de la siguiente pieza de documentación de keras Model (API funcional) batch_size: Integer o None. Número de muestras por actualización de gradiente. Si no se […]

¿Cómo usar los pesos evento por evento en Tensorflow?

En mi conjunto de datos tengo para cada entrada (evento) un peso. Este peso consta de varias cantidades, pero básicamente representa la importancia de este evento para los datos y debe tenerse en cuenta. ¿Cómo puedo usar estos pesos cuando entreno en Tensorflow? No quiero simplemente usar esto como otra característica. Gracias

implementando un clasificador de perceptron

Hola, soy bastante nuevo en Python y en la PNL. Necesito implementar un clasificador de perceptron. Busqué en algunos sitios web pero no encontré suficiente información. Por ahora tengo varios documentos que agrupé según la categoría (deportes, entretenimiento, etc.). También tengo una lista de las palabras más utilizadas en estos documentos junto con sus frecuencias. […]

Tren clasificador de imágenes multi-clase en Keras

Estaba siguiendo un tutorial para aprender a entrenar un clasificador usando Keras https://blog.keras.io/building-powerful-image-classification-models-using-very-little-data.html Específicamente, a partir del segundo guión dado por el autor, quise transformar el guión en uno que pueda entrenar un clasificador de clases múltiples (era un binario para perros y gatos). Tengo 5 clases en la carpeta de mi tren, así que […]

Conversión de dataframe pandas a marco h2o de manera eficiente

Tengo un dataframe de Pandas que tiene Encoding: latin-1 y está delimitado por ; . El dataframe es muy grande casi del size: 350000 x 3800 . Quería usar Sklearn inicialmente, pero mi dataframe tiene valores faltantes ( NAN values ), por lo que no podría usar los bosques aleatorios de Sklearn o GBM. Así […]

¿Cómo predecir la imagen de entrada usando un modelo entrenado en Keras?

Estoy empezando solo con keras y aprendizaje automático en general. Entrené un modelo para clasificar imágenes de 2 clases y lo model.save() utilizando model.save() . Aquí está el código que utilicé: from keras.preprocessing.image import ImageDataGenerator from keras.models import Sequential from keras.layers import Conv2D, MaxPooling2D from keras.layers import Activation, Dropout, Flatten, Dense from keras import backend […]

¿Cuáles son las buenas características para clasificar fotos de ropa?

Quiero construir un clasificador de ropa que tome una foto de una prenda de ropa y la clasifique como ‘jeans’, ‘vestido’, ‘entrenadores’, etc. Algunos ejemplos: Estas imágenes provienen de sitios web de minoristas, por lo que normalmente se toman desde el mismo ángulo, generalmente en un fondo blanco o pálido, tienden a ser muy similares. […]

Agrupación jerárquica de 1 millón de objetos.

¿Alguien puede indicarme una herramienta de agrupación jerárquica (preferible en python) que puede agrupar ~ 1 millón de objetos? He intentado hcluster y también naranja . hcluster tuvo problemas con objetos de 18k. Orange pudo agrupar objetos de 18k en segundos, pero falló con objetos de 100k (memoria saturada y finalmente se bloqueó). Estoy ejecutando […]

¿Cómo saber qué modelo de Keras es mejor?

No entiendo qué precisión usar en la salida para comparar mis modelos de 2 Keras para ver cuál es mejor. ¿Utilizo el “acc” (de los datos de entrenamiento) uno o el “val acc” (de los datos de validación)? Hay diferentes accs y val accs para cada época. ¿Cómo sé el acc o val acc para […]

Clasificación de precisión después de la recuperación y precisión

Me pregunto si esta es una forma legítima de calcular la precisión de la clasificación: obtener umbrales de recuperación de precisión para cada umbral binarize las y_scores continuas calcule su precisión a partir de la tabla de contingencia (matriz de confusión) Devuelve la precisión media para los umbrales. recall, precision, thresholds = precision_recall_curve(np.array(np_y_true), np.array(np_y_scores)) accuracy […]