Articles of clasificación

Combinando modelos de bosques al azar en scikit learn.

Tengo dos modelos de RandomForestClassifier, y me gustaría combinarlos en un metamodelo. Ambos fueron entrenados usando datos similares, pero diferentes. ¿Cómo puedo hacer esto? rf1 #this is my first fitted RandomForestClassifier object, with 250 trees rf2 #this is my second fitted RandomForestClassifier object, also with 250 trees Quiero crear big_rf con todos los árboles combinados […]

Agrupe objetos de fecha arbitrarios que estén dentro de un rango de tiempo entre sí

Quiero dividir el calendario en intervalos de dos semanas a partir de 2008-May-5 , o cualquier punto de partida arbitrario. Así que empiezo con varios objetos de fecha: import datetime as DT raw = (“2010-08-01”, “2010-06-25”, “2010-07-01”, “2010-07-08”) transactions = [(DT.datetime.strptime(datestring, “%Y-%m-%d”).date(), “Some data here”) for datestring in raw] transactions.sort() Al analizar manualmente las fechas, […]

scikit learn output metrics.classification_report en formato CSV / tab-delimited

Estoy haciendo una clasificación de texto multiclase en Scikit-Learn. El conjunto de datos está siendo entrenado usando el clasificador Multinomial Naive Bayes que tiene cientos de tags. Aquí hay un extracto del script de Scikit Learn para ajustar el modelo MNB from __future__ import print_function # Read **`file.csv`** into a pandas DataFrame import pandas as […]

Cómo usar una ordenación de predicados personalizada con Python

Tengo una lista de listas como [[1,2,”s”],[1,5,”e”],…] donde el 3er valor siempre es s o e . ¿Cómo puedo llamar a sort() para que la lista se sort() en función de: el primer índice Si el primer índice es el mismo, s viene primero. Gracias

Clasificación de múltiples índices en pandas

Tengo un conjunto de datos con columnas de múltiples índices en un df pandas que me gustaría ordenar por valores en una columna específica. He intentado usar sortindex y sortlevel pero no he podido obtener los resultados que estoy buscando. Mi conjunto de datos se ve como: Group1 Group2 ABCABC 1 1 0 3 2 […]

Leyendo un archivo .arff e intentando ignorar el encabezado

Soy nuevo en Python y necesito ayuda con mi código. Estoy leyendo un Arff con mi cuaderno jupyter usando pyhton2.7. Me gustaría saber qué argumento necesito poner en arff.lodarff, u otra forma de hacerlo, así puedo ignorar el encabezado de mis datos. rain,meta = arff.loadarff(open(‘train.arff’, ‘r’)) Después de leer el archivo, estoy haciendo algunas operaciones […]

¿Ordenar eficientemente una matriz numpy en orden descendente?

Me sorprende que esta pregunta específica no se haya hecho antes, pero realmente no la encontré en SO ni en la documentación de np.sort . Digamos que tengo una matriz de números aleatorios que contienen enteros, por ejemplo: > temp = np.random.randint(1,10, 10) > temp array([2, 4, 7, 4, 2, 2, 7, 6, 4, 4]) […]

Scikit-learn: Cómo obtener True Positive, True Negative, False Positive y False Negative

Mi problema: Tengo un conjunto de datos que es un archivo JSON grande. Lo leo y lo trainList en la variable trainList . A continuación, lo preproduzco para poder trabajar con él. Una vez hecho esto empiezo la clasificación: Utilizo el método de validación cruzada kfold para obtener la precisión media y entrenar a un […]

Explicación de Merge Sort para Dummies

Encontré este código en línea: def merge(left, right): result = [] i ,j = 0, 0 while i < len(left) and j < len(right): if left[i] <= right[j]: result.append(left[i]) i += 1 else: result.append(right[j]) j += 1 result += left[i:] result += right[j:] return result def mergesort(list): if len(list) < 2: return list middle = […]

Ordenar una lista de cadenas de fecha de Python

Tengo una lista: a = [‘7-Mar-14′, ’10-Mar-14′, ’11-Mar-14′, ’14-Mar-14′, ’15-Mar-14′, ’17-Mar-14′, ’22-Mar-14′, ’23-Mar-14′, ’25-Mar-14’, ‘1-Nov-13’, ‘5-Nov-13’, ‘8-Nov-13′, ’23-Nov-13′, ’24-Nov-13′, ’25-Nov-13′, ’26-Nov-13’, ‘3-Dec-13’, ‘9-Dec-13′, ’13-Dec-13’, ‘9-Jan-14′, ’17-Jan-14′, ’20-Jan-14’, ‘8-Feb-14’, ‘9-Feb-14′, ’10-Feb-14′, ’11-Feb-14′, ’12-Feb-14′, ’16-Feb-14′, ’17-Feb-14′, ’19-Feb-14′, ’22-Feb-14′, ’26-Feb-14′, ’28-Feb-14’, ‘2-Mar-14’, ‘4-Mar-14′, ’31-Mar-14’, ‘1-Apr-14’, ‘2-Apr-14’, ‘4-Apr-14’, ‘6-Apr-14’, ‘8-Apr-14’, ‘9-Apr-14′, ’15-Apr-14′, ’16-Apr-14′, ’17-Apr-14′, ’18-Apr-14′, ’20-Nov-13’, ‘5-Dec-13′, ’15-Dec-13′, ’15-Jan-14’, […]