Articles of svm

¿Cómo puedo guardar una instancia de objeto Python LibSVM?

Quería usar este clasificador en otra computadora sin tener que entrenarlo nuevamente. Solía ​​guardar algunos clasificadores de scikit con cPickle. Haciendo lo mismo con LIBSVM me da un “ValueError: los objetos ctypes que contienen punteros no pueden ser decapados”. Estoy usando LibSVM 3.1 y Python 2.7.3. Gracias from libsvm.svm import * from libsvm.svmutil import * […]

Multiprocesamiento en un modelo con dataframe como entrada

Quiero utilizar el multiprocesamiento en un modelo para obtener predicciones utilizando un dataframe como entrada. Tengo el siguiente código: def perform_model_predictions(model, dataFrame, cores=4): try: with Pool(processes=cores) as pool: result = pool.map(model.predict, dataFrame) return result # return model.predict(dataFrame) except AttributeError: logging.error(“AttributeError occurred”, exc_info=True) El error que estoy recibiendo es: raise TypeError(“sparse matrix length is ambiguous; use […]

cómo ajustar los parámetros de la función del kernel personalizada con canalización en scikit-learn

Actualmente, he definido con éxito una función de kernel personalizada (pre-computando la matriz del kernel) usando la función def, y ahora estoy usando la función GridSearchCV para obtener los mejores parámetros. por lo tanto, en la función de kernel personalizada, hay un total de 2 parámetros que se ajustarán (a saber, gamm y sea_gamma en […]

Predicción con ki cuadrado de chi para multilabel usando sklearn

Estoy tratando de obtener predicciones para un SVM usando un kernel de chi-cuadrado precalculado. Sin embargo, tengo problemas al intentar ejecutar clf.predict (). min_max_scaler = preprocessing.MinMaxScaler() X_train_scaled = min_max_scaler.fit_transform(features_train) X_test_scaled = min_max_scaler.transform(features_test) K = chi2_kernel(X_train_scaled) svm = SVC(kernel=’precomputed’, cache_size=1000).fit(K, labels_train) y_pred_chi2 = svm.predict(X_test_scaled) El error que estoy recibiendo es el siguiente: ValueError: bad input shape […]

Recibiendo una advertencia de desaprobación en Sklearn sobre la matriz 1d, a pesar de no tener una matriz 1D

Estoy tratando de usar SKLearn para ejecutar un modelo SVM. Solo lo estoy probando ahora con algunos datos de muestra. Aquí están los datos y el código: import numpy as np from sklearn import svm import random as random A = np.array([[random.randint(0, 20) for i in range(2)] for i in range(10)]) lab = [0, 1, […]

¿Cómo utilizo tags de cadena no enteras con SVM de scikit-learn? Pitón

Scikit-learn tiene módulos Python bastante fáciles de usar para el aprendizaje automático. Estoy tratando de entrenar a un etiquetador SVM para el procesamiento de lenguaje natural (NLP) donde mis tags y datos de entrada son palabras y anotaciones. Por ejemplo, el etiquetado de parte de la voz, en lugar de usar datos de doble / […]

Prepare los datos para la clasificación de texto usando Scikit Learn SVM

Estoy tratando de aplicar SVM de Scikit para clasificar los tweets que he recostackdo. Entonces, habrá dos categorías, nombre A y B. Por ahora, tengo todos los tweets categorizados en dos archivos de texto, ‘A.txt’ y ‘B.txt’. Sin embargo, no estoy seguro de qué tipo de datos ingresan los Scikit Learn SVM. Tengo un diccionario […]

¿Cómo arreglar la tasa de falsos positivos de un SVM lineal?

Soy un novato en SVM y este es mi caso de uso: tengo una gran cantidad de datos no balanceados para ser clasificados en binario utilizando un SVM lineal. Necesito corregir la tasa de falsos positivos en ciertos valores y medir los falsos negativos correspondientes para cada valor. Estoy usando algo como el siguiente código […]

ValueError: este solucionador necesita muestras de al menos 2 clases en los datos, pero los datos contienen solo una clase: 1.0

Tengo un conjunto de datos de entrenamiento de 8670 pruebas y cada prueba tiene una longitud de 125 muestras de tiempo, mientras que mi prueba consta de 578 pruebas. Cuando aplico el algoritmo SVM de scikit-learn, obtengo resultados bastante buenos. Sin embargo, cuando aplico la regresión logística, se produce este error: “ValueError: este solucionador necesita […]

Probabilidades confusas del predict_proba de svm de scikit-learn

Mi propósito es dibujar la curva PR por la probabilidad ordenada de cada muestra para una clase específica. Sin embargo, encontré que las probabilidades obtenidas por predict_proba () de svm tienen dos comportamientos diferentes cuando uso dos conjuntos de datos estándar diferentes: el iris y los dígitos. El primer caso se evalúa con el caso […]