Articles of aprendizaje de máquina

confundido acerca de random_state en el árbol de decisión de scikit learn

Confundido sobre el parámetro random_state , no estoy seguro de por qué el entrenamiento en el árbol de decisiones necesita algo de aleatoriedad. Mis pensamientos, (1) ¿está relacionado con un bosque aleatorio? (2) ¿Está relacionado con el conjunto de datos de pruebas de entrenamiento dividido? Si es así, ¿por qué no usar el método split […]

Keras modelo no aprendiendo

Mi modelo Keras no está aprendiendo nada y no puedo entender por qué. Incluso reduje el tamaño del conjunto de entrenamiento a 5 elementos y el modelo aún no se ajusta a los datos de entrenamiento. Función de pérdida visualizada con TensorBoard. Aquí está mi código: model = Sequential() model.add(Conv1D(30, filter_length=3, activation=’relu’, input_shape=(50, 1))) model.add(Conv1D(40, […]

¿Cómo boost los factores de la matriz en Spark ALS recomendar?

Soy un principiante en el mundo del aprendizaje automático y el uso de Apache Spark. He seguido el tutorial en https://databricks-training.s3.amazonaws.com/movie-recommendation-with-mllib.html#augmenting-matrix-factors , y pude desarrollar la aplicación con éxito. Ahora, como se requiere que la aplicación web de hoy tenga que ser impulsada por recomendaciones en tiempo real, me gustaría que mi modelo esté listo […]

La función de costo siempre devuelve cero para una clasificación binaria en tensorflow

He escrito el siguiente progtwig de clasificación binaria en tensorflow que tiene errores. El costo vuelve a ser cero todo el tiempo, sin importar cuál sea la entrada. Estoy tratando de depurar un progtwig más grande que no está aprendiendo nada de los datos. He reducido al menos un error a la función de costo […]

Determinación de las características más contribuyentes para el clasificador SVM en sklearn

Tengo un conjunto de datos y quiero entrenar mi modelo en esos datos. Después del entrenamiento, necesito conocer las características que son los principales contribuyentes en la clasificación de un clasificador SVM. Hay algo llamado característica importante para los algoritmos forestales, ¿hay algo similar?

Concatenar funciones personalizadas con CountVectorizer

Tengo un montón de archivos con artículos. Para cada artículo debe haber algunas características, como: longitud del texto , text_spam (todas son ints o flotantes, y en la mayoría de los casos deben cargarse desde csv). Y lo que quiero hacer es combinar estas funciones con CountVectorizer y luego clasificar esos textos. He visto algunos […]

Umbral de decisión personalizado de Keras para precisión y recuperación.

Estoy haciendo una clasificación binaria utilizando Keras (con backend Tensorflow ) y tengo un 76% de precisión y un 70% de recuperación. Ahora quiero intentar jugar con el umbral de decisión. Por lo que sé, Keras usa el umbral de decisión 0.5. ¿Hay alguna forma en Keras de usar un umbral personalizado para la precisión […]

Datos periódicos con aprendizaje automático (como angularjs de grado -> 179 es 2 diferentes de -179)

Estoy usando Python para las estimaciones de densidad del kernel y los modelos de mezcla gaussianos para clasificar la probabilidad de muestras de datos multidimensionales. Cada dato es un ángulo, y no estoy seguro de cómo manejar la periodicidad de los datos angulares para el aprendizaje automático. Primero, eliminé todos los angularjs negativos agregándoles 360, […]

Haz predicciones usando un gráfico de tensorflow de un modelo de keras

Tengo un modelo entrenado utilizando Keras con Tensorflow como mi backend, pero ahora necesito convertir mi modelo en un gráfico de tensorflow para una aplicación determinada. Intenté hacer esto y hacer predicciones para asegurar que está funcionando correctamente, pero al compararlo con los resultados obtenidos de model.predict () obtengo valores muy diferentes. Por ejemplo: from […]

Evaluar múltiples puntuaciones en sklearn cross_val_score

Estoy tratando de evaluar múltiples algoritmos de aprendizaje automático con sklearn para un par de métricas (precisión, recuperación, precisión y quizás más). Por lo que entendí de la documentación aquí y del código fuente (estoy usando sklearn 0.17), la función cross_val_score solo recibe un anotador por cada ejecución. Así que para calcular múltiples puntuaciones, tengo […]