Articles of validación cruzada

NaNs apareciendo de repente para sklearn KFolds

Estoy tratando de ejecutar la validación cruzada en mi conjunto de datos. Los datos parecen estar limpios, pero luego, cuando bash ejecutarlos, algunos de mis datos son reemplazados por NaNs. No estoy seguro de por qué. Alguien ha visto esto antes? y, X = np.ravel(df_test[‘labels’]), df_test[[‘variation’, ‘length’, ‘tempo’]] X_train, X_test, y_train, y_test = cv.train_test_split(X,y,test_size=.30, random_state=4444) […]

Alternar diferentes modelos en Pipeline para GridSearchCV

Quiero construir un Pipeline en sklearn y probar diferentes modelos usando GridSearchCV. Solo un ejemplo (por favor, no preste atención a qué modelos particulares se eligen): reg = LogisticRegression() proj1 = PCA(n_components=2) proj2 = MDS() proj3 = TSNE() pipe = [(‘proj’, proj1), (‘reg’ , reg)] pipe = Pipeline(pipe) param_grid = { ‘reg__c’: [0.01, 0.1, 1], […]

Uso de un conjunto de validación explícito (predefinido) para la búsqueda en cuadrícula con sklearn

Tengo un conjunto de datos, que previamente se ha dividido en 3 conjuntos: entrenamiento, validación y prueba. Estos conjuntos deben usarse como se indica para poder comparar el rendimiento en diferentes algoritmos. Ahora me gustaría optimizar los parámetros de mi SVM usando el conjunto de validación. Sin embargo, no puedo encontrar cómo ingresar el conjunto […]

Usando sklearn cross_val_score y kfolds para ajustar y ayudar a predecir el modelo

Estoy tratando de entender el uso de la validación cruzada de kfolds desde el módulo sklearn python. Entiendo el flujo básico: instanciar un modelo, por ejemplo, model = LogisticRegression() ajuste del modelo, por ejemplo, model.fit(xtrain, ytrain) predicción, por ejemplo, model.predict(ytest) use, por ejemplo, la puntuación de valor cruzado para probar la precisión del modelo ajustado […]

Cómo utilizar la validación cruzada de un k-fold en scikit con el clasificador de bayes y NLTK ingenuo

Tengo un pequeño corpus y quiero calcular la precisión del ingenuo clasificador de Bayes usando una validación cruzada de 10 veces, ¿cómo puedo hacerlo?

Transformadores personalizados de Sklearn: diferencia entre el uso de FunctionTransformer y la subclasificación de TransformerMixin

Para realizar un CV adecuado, es recomendable utilizar tuberías para que se puedan aplicar las mismas transformaciones a cada pliegue en el CV. Puedo definir transformaciones personalizadas utilizando sklearn.preprocessing.FunctionTrasformer o subclassing sklearn.base.TransformerMixin . ¿Cuál es el enfoque recomendado? ¿Por qué?

Cómo acceder a las puntuaciones de validación cruzada de Scikit Learn anidadas

Estoy usando python y me gustaría usar validación cruzada anidada con scikit learn. He encontrado un muy buen ejemplo : NUM_TRIALS = 30 non_nested_scores = np.zeros(NUM_TRIALS) nested_scores = np.zeros(NUM_TRIALS) # Choose cross-validation techniques for the inner and outer loops, # independently of the dataset. # Eg “LabelKFold”, “LeaveOneOut”, “LeaveOneLabelOut”, etc. inner_cv = KFold(n_splits=4, shuffle=True, random_state=i) […]

ValueError: n_splits = 10 no puede ser mayor que el número de miembros en cada clase

Estoy tratando de ejecutar el siguiente código: from sklearn.model_selection import StratifiedKFold X = [“hey”, “join now”, “hello”, “join today”, “join us now”, “not today”, “join this trial”, ” hey hey”, ” no”, “hola”, “bye”, “join today”, “no”,”join join”] y = [“n”, “r”, “n”, “r”, “r”, “n”, “n”, “n”, “n”, “r”, “n”, “n”, “n”, “r”] skf […]

Validación cruzada en LightGBM

Después de leer la documentación de LightGBM sobre validación cruzada, espero que esta comunidad pueda aclarar los resultados de la validación cruzada y mejorar nuestras predicciones utilizando LightGBM. ¿Cómo se supone que debemos usar la salida del diccionario de lightgbm.cv para mejorar nuestras predicciones? Aquí hay un ejemplo: entrenamos nuestro modelo de CV con el […]

¿Cómo utilizar la búsqueda de la red con el generador de ajuste en keras

Quiero hacer una cuadrícula, buscar el parámetro del modelo con fit_generator como entrada en keras Encuentro el código de abajo en el desbordamiento de stack y lo cambio 1- pero no entiendo cómo dar a fit_generator o flow_from_directory para que se ajuste a la función (última línea en el código) 2- ¿Cómo se puede agregar […]