Articles of clasificación

python: ordena una lista de números sin una ordenación incorporada, función mínima, máxima

Si tengo una lista que varía en longitud cada vez y quiero clasificarla de la más baja a la más alta, ¿cómo lo haría? Si tengo: [-5, -23, 5, 0, 23, -6, 23, 67] Quiero: [-23, -6, -5, 0, 5, 23, 23, 67] Empiezo con esto: data_list = [-5, -23, 5, 0, 23, -6, 23, […]

Sklearn LogisticRegression y cambio del umbral predeterminado para la clasificación

Estoy usando LogisticRegression del paquete sklearn y tengo una pregunta rápida sobre la clasificación. Construí una curva ROC para mi clasificador, y resulta que el umbral óptimo para mis datos de entrenamiento es de alrededor de 0.25. Supongo que el umbral predeterminado al crear predicciones es 0.5. ¿Cómo puedo cambiar esta configuración predeterminada para averiguar […]

Ordenar una lista secundaria de elementos en una lista dejando el rest en su lugar

Digamos que tengo una lista ordenada de cadenas como en: [‘A’, ‘B’ , ‘B1’, ‘B11’, ‘B2’, ‘B21’, ‘B22’, ‘C’, ‘C1’, ‘C11’, ‘C2’] Ahora quiero ordenar según el valor numérico final para las B s, así que tengo: [‘A’, ‘B’ , ‘B1’, ‘B2’, ‘B11’, ‘B21’, ‘B22’, ‘C’, ‘C1’, ‘C11’, ‘C2’] Un posible algoritmo sería regex = […]

Predecir cuánto tiempo tardará en ejecutarse una clasificación de scikit-learn

¿Hay alguna forma de predecir cuánto tiempo tomará ejecutar un clasificador desde sci-kit learn según los parámetros y el conjunto de datos? Lo sé, bastante meta, ¿verdad? Algunas clasificaciones / combinaciones de parámetros son bastante rápidas, y otras toman tanto tiempo que eventualmente acabo con el proceso. Me gustaría una manera de estimar por adelantado […]

Python sort sin expresiones lambda

A menudo hago clases en Python usando expresiones lambda, y aunque funciona bien, me parece que no es muy legible, y esperaba que pudiera haber una mejor manera. Aquí hay un caso de uso típico para mí. Tengo una lista de números, por ejemplo, x = [12, 101, 4, 56, …] Tengo una lista separada […]

clasificación de radios vectorizadas con numpy – ¿puede superar np.sort?

Numpy aún no tiene una clasificación de radix, así que me pregunté si era posible escribir uno usando funciones numpy pre-existentes. Hasta ahora tengo lo siguiente, que sí funciona, pero es aproximadamente 10 veces más lento que el pedido rápido de numpy. Prueba y punto de referencia: a = np.random.randint(0, 1e8, 1e6) assert(np.all(radix_sort(a) == np.sort(a))) […]

Encontrar el índice de elementos ordenados en Python Array

He visto respuestas a la pregunta: ¿Es posible organizar una matriz numpy (o lista de python) usando los índices de los elementos en orden decreciente? (por ejemplo, encontrar el índice de N elementos más grandes en Python Array / List Efficiently ) Una respuesta muy concisa parece ser (desde el enlace de arriba): L = […]

Python Pandas clasificando por multiindex y columna

En Pandas 0.17 trato de ordenar por una columna específica manteniendo el índice jerárquico (A y B). B es un número de ejecución creado al configurar el dataframe a través de la concatenación. Mis datos se ven así: CD AB bar one shiny 10 two dull 5 three glossy 8 foo one dull 3 two […]

deshacer o revertir argsort (), python

Dada una matriz ‘a’ me gustaría ordenar la matriz por columnas “ordenar (a, eje = 0)” hacer algunas cosas en la matriz y luego deshacer la ordenación. Con eso no me refiero a reordenar, sino básicamente invertir el modo en que se movió cada elemento. Supongo que argsort () es lo que necesito, pero no […]

¿Algoritmo recursivo funciona sin statement de retorno? (Corre muy rápido)

Intenté implementar la combinación de ordenación en Python. De alguna manera, este fragmento de código se ejecuta correctamente (y bastante rápido), pero no sé por qué: no hay una statement de retorno en mergeSort () from sys import stdin def mergeSort(A): if len(A) > 1: m = int(len(A)/2) L = A[:m] R = A[m:] mergeSort(L) […]