Articles of aprendizaje de máquina

Imprima la ruta de decisión de una muestra específica en un clasificador de bosque aleatorio

Cómo imprimir la ruta de decisión de un bosque aleatorio en lugar de la ruta de árboles individuales en un bosque aleatorio para una muestra específica. import numpy as np import pandas as pd from sklearn.datasets import make_classification from sklearn.ensemble import RandomForestClassifier X, y = make_classification(n_samples=1000, n_features=6, n_informative=3, n_classes=2, random_state=0, shuffle=False) # Creating a dataFrame […]

Incremental algoritmo de vecino más cercano en Python

¿Alguien sabe de un algoritmo vecino más cercano implementado en Python que pueda actualizarse de manera incremental? Todos los que he encontrado, como este , parecen ser procesos por lotes. ¿Es posible implementar un algoritmo NN incremental?

Descenso por lotes con scikit learn (sklearn)

Estoy jugando con un clasificador de Regresión logística uno-contra-todos usando Scikit-Learn (sklearn). Tengo un conjunto de datos grande que es demasiado lento para ejecutarlo todo de una vez; También me gustaría estudiar la curva de aprendizaje a medida que avanza la formación. Me gustaría usar el descenso de gradiente por lotes para entrenar a mi […]

TfidfVectorizer en scikit-learn: ValueError: np.nan no es un documento válido

Estoy usando TfidfVectorizer de scikit-learn para realizar una extracción de características a partir de datos de texto. Tengo un archivo CSV con una Puntuación (puede ser +1 o -1) y una Revisión (texto). Metí estos datos en un DataFrame para poder ejecutar el Vectorizer. Este es mi código: import pandas as pd import numpy as […]

Enumere las palabras en un vocabulario de acuerdo con la ocurrencia en un corpus de texto, Scikit-Learn

He instalado un CountVectorizer para algunos documentos en scikit-learn . Me gustaría ver todos los términos y su frecuencia correspondiente en el corpus de texto, para seleccionar palabras clave. Por ejemplo ‘and’ 123 times, ‘to’ 100 times, ‘for’ 90 times, … and so on ¿Hay alguna función incorporada para esto?

Regresión del proceso gaussiano de múltiples salidas en scikit-learn

Estoy utilizando scikit learn para la operación de regresión del proceso gaussiano (GPR) para predecir datos. Mis datos de entrenamiento son los siguientes: x_train = np.array([[0,0],[2,2],[3,3]]) #2-D cartesian coordinate points y_train = np.array([[200,250, 155],[321,345,210],[417,445,851]]) #observed output from three different datasources at respective input data points (x_train) Los puntos de prueba (2-D) donde se debe predecir […]

¿Cómo usar un kernel SVM personalizado?

Me gustaría implementar mi propio kernel gaussiano en Python, solo para hacer ejercicio. Estoy usando: sklearn.svm.SVC(kernel=my_kernel) pero realmente no entiendo lo que está pasando. Espero que la función my_kernel sea llamada con las columnas de la matriz X como parámetros, en lugar de eso, la llamé con X , X como argumentos. Mirando los ejemplos […]

Cómo encontrar la clase correspondiente en clf.predict_proba ()

Tengo varias clases y los vectores de características correspondientes, y cuando ejecute predict_proba () obtendré esto: classes = [‘one’,’two’,’three’,’one’,’three’] feature = [[0,1,1,0],[0,1,0,1],[1,1,0,0],[0,0,0,0],[0,1,1,1]] from sklearn.naive_bayes import BernoulliNB clf = BernoulliNB() clf.fit(feature,classes) clf.predict_proba([0,1,1,0]) >> array([[ 0.48247836, 0.40709111, 0.11043053]]) Me gustaría saber qué probabilidad corresponde a qué clase. En esta página dice que están ordenados por orden aritmético, […]

¿Cómo convertir matrices numpy al formato estándar TensorFlow?

Tengo dos matrices de numpy uno que contiene imágenes captcha y otro que contiene las tags correspondientes (en formato vectorial de un solo calor) Quiero cargar estos en TensorFlow para poder clasificarlos usando una neural network. ¿Cómo se puede hacer esto? ¿Qué forma deben tener las matrices numpy? Información adicional: mis imágenes tienen 60 (altura) […]

¿Cómo se entrenan varios modelos en un solo script en TensorFlow cuando hay GPUs presentes?

Digamos que tengo acceso a un número de GPU en una sola máquina (por el bien del argumento, supongamos 8GPU cada una con una memoria máxima de 8 GB en una sola máquina con cierta cantidad de RAM y disco). Quería ejecutar en un solo script y en una sola máquina un progtwig que evalúa […]