Articles of clasificación

Tratar el desequilibrio de clase en la clasificación binaria.

Aquí hay una breve descripción de mi problema: Estoy trabajando en una tarea de aprendizaje supervisado para entrenar a un clasificador binario . Tengo un conjunto de datos con una distribución de desequilibrio de clase grande: 8 casos negativos cada uno positivo. Utilizo la medida f , es decir, la media armónica entre especificidad y […]

Implementación Python OpenCV SVM

Así que tengo una matriz con mis imágenes de muestra (todas convertidas en vectores) que se ejecutó a través de PCA / LDA, y un vector que denota la clase a la que pertenece cada imagen. Ahora quiero usar la clase OpenCV SVM para entrenar a mi SVM (estoy usando Python, OpenCV 2.3.1). Pero tengo […]

Ordena un archivo por primera (o segunda, o bien) columna en python

Esta parece una pregunta muy básica, pero soy nuevo en Python, y después de pasar mucho tiempo tratando de encontrar una solución por mi cuenta, ¡pensé que es hora de preguntar a algunas personas más avanzadas! Entonces, tengo un archivo (muestra): ENSMUSG00000098737 95734911 95734973 3 miRNA ENSMUSG00000077677 101186764 101186867 4 snRNA ENSMUSG00000092727 68990574 68990678 11 […]

La mejor manera de combinar clasificadores probabilísticos en scikit-learn

Tengo una regresión logística y un bosque aleatorio y me gustaría combinarlos (conjunto) para el cálculo de probabilidad de clasificación final tomando un promedio. ¿Hay una forma integrada de hacer esto en sci-kit learn? ¿Alguna forma en la que pueda usar el conjunto de los dos como un clasificador? ¿O necesitaría rodar mi propio clasificador?

Ordenando enteros en un archivo csv – python

Tengo un archivo csv que se ve así: Tom,10 Jack,10 Alice,10 Ben,9 Necesito poder ordenar por la segunda columna de mayor a menor. He intentado el siguiente código: import csv file = open(“bestscores.csv”,”r”) reader = csv.reader(file, delimiter = ‘ ‘) sort = sorted(reader,key=lambda x: int(x[1]), reverse=True) print(sort) Esto resulta en el siguiente error: ValueError: invalid […]

PyQt: cómo ordenar las columnas QTableView de un archivo excel (cadenas y números y tipo de datos)

Esta es una pregunta de seguimiento para: PyQt: cómo ordenar las columnas de QTableView (cadenas y números) Ahora planeo hacer la misma clasificación para los archivos de Excel Aquí está mi código: self.Upload = QtGui.QPushButton() self.Upload.clicked.connect(self.showOpenDialog) self.Table = QtGui.QPushButton() self.table.clicked.connect(self.LoadTable) def showOpenDialog(self): fileName = QtGui.QFileDialog.getOpenFileName(self, ‘Open file’, ‘/home’) if (“.xls” or “.xml” or “.xlsx” or […]

Ordenar los contenedores de los pandas cortados

Usando pandas cortar , puedo definir ubicaciones proporcionando los bordes y pandas crea ubicaciones como (a, b] . Mi pregunta es ¿cómo puedo ordenar los contenedores (de la más baja a la más alta)? import numpy as np import pandas as pd y = pd.Series(np.random.randn(100)) x1 = pd.Series(np.sign(np.random.randn(100))) x2 = pd.cut(pd.Series(np.random.randn(100)), bins = [-3, -0.5, […]

Insertar elemento en una lista ordenada que no distingue entre mayúsculas y minúsculas en Python

Tengo una lista de cadenas que ya está ordenada en un orden que no distingue entre mayúsculas y minúsculas. Me gustaría insertar una nueva cadena en la lista. Una forma de hacer esto es agregar el elemento y luego ordenar la lista, de esta manera: myList.append(‘Something’) myList.sort(key=lambda s: s.lower()) Pero me preguntaba si hay una […]

Clasificación de datos de Python Panda con mes – año

Soy un principiante de python y pandas y tengo problemas para ordenar un dataframe después de una operación grupal. Puedo obtener datos ordenados después de agrupar y contar, pero cuando puse todos los datos en otro dataframe, no obtengo datos ordenados. Aquí está mi bash conn = sqlite3.connect(‘Demo.sqlite’) df = pd.read_sql(“SELECT * FROM Table where […]

¿Cómo ordenar de manera eficiente en PySpark?

Quiero ordenar mis tuplas K, V por V, es decir, por el valor. Sé que TakeOrdered es bueno para esto si sabes cuántos necesitas: b = sc.parallelize([(‘t’,3),(‘b’,4),(‘c’,1)]) Utilizando TakeOrdered: b.takeOrdered(3,lambda atuple: atuple[1]) Usando Lambda b.map(lambda aTuple: (aTuple[1], aTuple[0])).sortByKey().map( lambda aTuple: (aTuple[0], aTuple[1])).collect() He comprobado la pregunta aquí , que sugiere lo último. Me resulta difícil […]