Articles of clasificación

Ordena un subconjunto de una lista de python para que tenga el mismo orden relativo que en otra lista

Así que tener una lista diga b = [b1, b2, b3] Quiero poder ordenar una lista a de tal manera que todos los bi que también existen en a tengan el mismo orden relativo que en b – dejando el rest de los elementos de un solo. Asi que a = [ b1, x, b3, […]

¿Predecir clases o probabilidades de clase?

Actualmente estoy usando H2O para un conjunto de datos de problemas de clasificación. Lo estoy probando con H2ORandomForestEstimator en un entorno de Python 3.6. Noté que los resultados del método de predicción daban valores entre 0 y 1 (supongo que esto es la probabilidad). En mi conjunto de datos, el atributo de destino es numérico, […]

Clasificar imágenes sobre conceptos básicos de similitud.

Tengo 30, 40 imágenes de seres humanos, que quiero obtener en código Python. Y hacer grupo de fotos similares. Como 5 pic de john y 10 de peter. Me gusta esto . Soy nuevo en el procesamiento de imágenes. Así que mi pregunta es qué algo es mejor para esto. Y quiero hacer esto en […]

El decapado de un clasificador entrenado produce resultados diferentes de los resultados obtenidos directamente de un clasificador recién entrenado pero idénticamente entrenado

Estoy tratando de elegir un clasificador SVM entrenado de la biblioteca de Scikit-learn para que no tenga que entrenarlo una y otra vez. Pero cuando paso los datos de prueba al clasificador cargado desde el pickle, obtengo valores inusualmente altos de precisión, f medida, etc. Si los datos de prueba se pasan directamente al clasificador […]

(Python Scipy) ¿Cómo aplanar un csr_matrix y añadirlo a otro csr_matrix?

Estoy representando cada documento XML como una matriz de características en un formato csr_matrix. Ahora que tengo alrededor de 3000 documentos XML, tengo una lista de csr_matrices. Quiero aplanar cada una de estas matrices para que se conviertan en vectores de características, luego quiero combinar todos estos vectores de características para formar un csr_matrix que […]

error numpy.sort () ValueError: el valor de verdad de una matriz con más de un elemento es ambiguo. Utilice a.any () o a.all ()

Cuando uso numpy para ordenar una matriz, surge este problema: Traceback (most recent call last): File “D:/Desktop/LIP/complier/num/f_t.py”, line 75, in frogs[i].sort(order=’length’) ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all() Pero si comento estos códigos, está bien. # if len < temp_len: # r_w[i]['length'] = len […]

ordenar 2d numpy array lexicográficamente

Tengo una gran matriz 2D con cientos de columnas. Me gustaría clasificarlo por lexicografía, es decir, por primera columna, luego por segunda columna, y así sucesivamente hasta la última columna. Me imagino que esto debería ser fácil de hacer, pero no he podido encontrar una manera rápida de hacerlo.

Preproceso de archivos de datos grandes con características categóricas y continuas

Primero, gracias por leerme y muchas gracias si puedes dar alguna pista que me ayude a resolver esto. Como soy nuevo en Scikit-learn, no dude en brindarme algún consejo que pueda ayudarme a mejorar el proceso y hacerlo más profesional. Mi objective es clasificar los datos entre dos categorías. Me gustaría encontrar una solución que […]

Clasificación de nombres por sus altas puntuaciones.

Quiero ordenar una lista de nombres por su puntuación. Lo que tengo hasta ahora es file = open(“scores.txt”, ‘r’) for line in file: name = line.strip() print(name) file.close() No estoy seguro de cómo ordenarlos. Aquí está el contenido del archivo: Matthew, 13 Luke, 6 John, 3 Bobba, 4 Lo que quiero que sea la salida: […]

Python: Ordenar lista de listas numéricamente

Tengo una lista de las coordenadas x , y que necesito ordenar según la coordenada x , luego la coordenada y cuando x es la misma y elimino los duplicados de las mismas coordenadas. Por ejemplo, si la lista es: [[450.0, 486.6], [500.0, 400.0], [450.0, 313.3], [350.0, 313.3], [300.0, 400.0], [349.9, 486.6], [450.0, 313.3]] Tendría […]