Articles of aprendizaje de máquina

Aprendizaje automático de Tensorflow: ¿No hay decodificador para imágenes TIFF?

Me he dado cuenta de que el paquete Tensorflow Python proporciona procedimientos estándar para decodificar imágenes jpeg , png y gif después de leer archivos. Por ejemplo para png : import tensorflow as tf filename_queue = tf.train.string_input_producer([‘/Image.png’]) # list of files to read reader = tf.WholeFileReader() key, value = reader.read(filename_queue) decoded_image = tf.image.decode_png(value) # use […]

Sklearn Pipeline: ¿Cómo construir para kmeans, agrupar texto?

Tengo el texto como se muestra: list1 = [“My name is xyz”, “My name is pqr”, “I work in abc”] Lo anterior será un conjunto de entrenamiento para agrupar texto usando kmeans. list2 = [“My name is xyz”, “I work in abc”] Lo anterior es mi conjunto de prueba. He construido un vectorizador y el […]

¿Puedo obtener una lista de predicciones erróneas en la función de puntuación de SVM en scikit-learn?

Podemos usar svm.SVC.score() para evaluar la precisión del modelo SVM. Quiero obtener la clase predicha y la clase real en caso de predicciones erróneas. ¿Cómo puedo lograr esto en scikit-learn ?

Validación cruzada anidada en la búsqueda de cuadrícula para núcleos precomputados en scikit-learn

Tengo un núcleo precomputado de tamaño NxN. Estoy usando GridSearchCV para ajustar el parámetro C de SVM con kernel = ‘precomputed’ de la siguiente manera: C_range = 10. ** np.arange(-2, 9) param_grid = dict(C=C_range) grid = GridSearchCV(SVC(kernel=’precomputed’), param_grid=param_grid, cv=StratifiedKFold(y=data_label, n_folds=10)) grid.fit(kernel, data_label) print grid.best_score_ Esto funciona bastante bien, sin embargo, ya que uso los datos […]

Tensorflow guarda el estado final de LSTM en dynamic_rnn para la predicción

Quiero guardar el estado final de mi LSTM para que se incluya cuando restauro el modelo y se puede usar para la predicción. Como se explica a continuación, el ahorrador solo tiene conocimiento del estado final cuando uso tf.assign . Sin embargo, esto produce un error (también se explica a continuación). Durante el entrenamiento, siempre […]

¿Hay algún tipo de paquete de clúster subespacial disponible en scikit-learn?

¿Hay algún tipo de paquetes de clústeres subespaciales disponibles en scikit-learn?

¿Cuál es la diferencia entre el peso de la clase = ninguno y el auto en svm scikit learn?

En scikit learn svm classifier cuál es la diferencia entre class_weight = None y class_weight = Auto. A partir de la documentación se entrega como Establezca el parámetro C de la clase i en class_weight [i] * C para SVC. Si no se da, todas las clases se supone que tienen un peso uno. El […]

Scikit Learn: cálculo de TF-IDF a partir de un conjunto de matrices de características en lugar de a partir de un conjunto de documentos sin procesar

El TfidfVectorizer de Scikit-Learn convierte una colección de documentos sin procesar en una matriz de características de TF-IDF. En lugar de documentos en bruto, me gustaría convertir una matriz de nombres de características a características de TF-IDF. El corpus que alimenta fit_transform() se supone que es una matriz de documentos en bruto, pero en su […]

Puntaje de F1 por clase para clasificación multi-clase

Estoy trabajando en un problema de clasificación multiclase usando python y scikit-learn. Actualmente, estoy usando la función ranking_report para evaluar el rendimiento de mi clasificador, obteniendo informes como los siguientes: >>> print(classification_report(y_true, y_pred, target_names=target_names)) precision recall f1-score support class 0 0.50 1.00 0.67 1 class 1 0.00 0.00 0.00 1 class 2 1.00 0.67 0.80 […]

Realización de una estimación de hiperparámetros para el estimador en cada pliegue de Eliminación de características recursivas

Estoy usando sklearn para llevar a cabo la eliminación recursiva de funciones con validación cruzada, usando el módulo RFECV. RFE implica entrenar repetidamente un estimador en el conjunto completo de características, luego eliminar las características menos informativas, hasta que converjan en el número óptimo de características. Para obtener un rendimiento óptimo por parte del estimador, […]