Articles of clasificación

Clasificación de nombres por sus altas puntuaciones.

Quiero ordenar una lista de nombres por su puntuación. Lo que tengo hasta ahora es file = open(“scores.txt”, ‘r’) for line in file: name = line.strip() print(name) file.close() No estoy seguro de cómo ordenarlos. Aquí está el contenido del archivo: Matthew, 13 Luke, 6 John, 3 Bobba, 4 Lo que quiero que sea la salida: […]

Python: Ordenar lista de listas numéricamente

Tengo una lista de las coordenadas x , y que necesito ordenar según la coordenada x , luego la coordenada y cuando x es la misma y elimino los duplicados de las mismas coordenadas. Por ejemplo, si la lista es: [[450.0, 486.6], [500.0, 400.0], [450.0, 313.3], [350.0, 313.3], [300.0, 400.0], [349.9, 486.6], [450.0, 313.3]] Tendría […]

Mensaje de error de Scikit learn ‘La precisión y el puntaje F no están bien definidos y están configurados a 0.0 en las tags’

Estoy trabajando en un modelo de clasificación binaria, el clasificador es ingenuo bayes. Tengo un conjunto de datos casi equilibrado; sin embargo, recibo el siguiente mensaje de error cuando predigo: UndefinedMetricWarning: Precision and F-score are ill-defined and being set to 0.0 in labels with no predicted samples. ‘precision’, ‘predicted’, average, warn_for) Estoy usando gridsearch con […]

Obtenga los valores de recuperación (sensibilidad) y precisión (PPV) de un problema de múltiples clases en PyML

Estoy usando PyML para la clasificación SVM. Sin embargo, noté que cuando evalúo un clasificador multiclase con LOO, el objeto de resultados no informa la sensibilidad y los valores de PPV. En su lugar son 0.0: from PyML import * from PyML.classifiers import multi mc = multi.OneAgainstRest(SVM()) data = VectorDataSet(‘iris.data’, labelsColumn=-1) result = mc.loo(data) result.getSuccessRate() […]

python: ordena una lista de números sin una ordenación incorporada, función mínima, máxima

Si tengo una lista que varía en longitud cada vez y quiero clasificarla de la más baja a la más alta, ¿cómo lo haría? Si tengo: [-5, -23, 5, 0, 23, -6, 23, 67] Quiero: [-23, -6, -5, 0, 5, 23, 23, 67] Empiezo con esto: data_list = [-5, -23, 5, 0, 23, -6, 23, […]

Sklearn LogisticRegression y cambio del umbral predeterminado para la clasificación

Estoy usando LogisticRegression del paquete sklearn y tengo una pregunta rápida sobre la clasificación. Construí una curva ROC para mi clasificador, y resulta que el umbral óptimo para mis datos de entrenamiento es de alrededor de 0.25. Supongo que el umbral predeterminado al crear predicciones es 0.5. ¿Cómo puedo cambiar esta configuración predeterminada para averiguar […]

Ordenar una lista secundaria de elementos en una lista dejando el rest en su lugar

Digamos que tengo una lista ordenada de cadenas como en: [‘A’, ‘B’ , ‘B1’, ‘B11’, ‘B2’, ‘B21’, ‘B22’, ‘C’, ‘C1’, ‘C11’, ‘C2’] Ahora quiero ordenar según el valor numérico final para las B s, así que tengo: [‘A’, ‘B’ , ‘B1’, ‘B2’, ‘B11’, ‘B21’, ‘B22’, ‘C’, ‘C1’, ‘C11’, ‘C2’] Un posible algoritmo sería regex = […]

Predecir cuánto tiempo tardará en ejecutarse una clasificación de scikit-learn

¿Hay alguna forma de predecir cuánto tiempo tomará ejecutar un clasificador desde sci-kit learn según los parámetros y el conjunto de datos? Lo sé, bastante meta, ¿verdad? Algunas clasificaciones / combinaciones de parámetros son bastante rápidas, y otras toman tanto tiempo que eventualmente acabo con el proceso. Me gustaría una manera de estimar por adelantado […]

Python sort sin expresiones lambda

A menudo hago clases en Python usando expresiones lambda, y aunque funciona bien, me parece que no es muy legible, y esperaba que pudiera haber una mejor manera. Aquí hay un caso de uso típico para mí. Tengo una lista de números, por ejemplo, x = [12, 101, 4, 56, …] Tengo una lista separada […]

clasificación de radios vectorizadas con numpy – ¿puede superar np.sort?

Numpy aún no tiene una clasificación de radix, así que me pregunté si era posible escribir uno usando funciones numpy pre-existentes. Hasta ahora tengo lo siguiente, que sí funciona, pero es aproximadamente 10 veces más lento que el pedido rápido de numpy. Prueba y punto de referencia: a = np.random.randint(0, 1e8, 1e6) assert(np.all(radix_sort(a) == np.sort(a))) […]