Articles of xgboost

La diferencia de XGBoost en las funciones de tren y prueba después de convertir a DMatrix

Solo me pregunto como es posible el siguiente caso: def fit(self, train, target): xgtrain = xgb.DMatrix(train, label=target, missing=np.nan) self.model = xgb.train(self.params, xgtrain, self.num_rounds) Pasé el conjunto de datos del tren como csr_matrix con 5233 columnas, y después de convertir a DMatrix obtuve 5322 características. Más adelante, predice el paso, obtuve un error como la causa […]

clasificación multiclase en xgboost (python)

No puedo averiguar cómo pasar el número de clases o métrica eval a xgb.XGBClassifier con la función objective ‘multi: softmax’. Miré muchas documentaciones pero la única charla sobre el contenedor sklearn que acepta n_class / num_class. Mi configuración actual se ve como kf = cross_validation.KFold(y_data.shape[0], \ n_folds=10, shuffle=True, random_state=30) err = [] # to hold […]

¿Cómo se calcula la puntuación de la característica (/ importancia) en el paquete XGBoost?

El comando xgb.importance devuelve un gráfico de la importancia de la característica medida por una puntuación f . ¿Qué representa esta puntuación f y cómo se calcula? Salida: Gráfico de importancia de la característica

XGBoost CV y ​​mejor iteración.

Estoy usando XGBoost cv para encontrar el número óptimo de rondas para mi modelo. Estaría muy agradecido si alguien pudiera confirmar (o refutar), el número óptimo de rondas es: estop = 40 res = xgb.cv(params, dvisibletrain, num_boost_round=1000000000, nfold=5, early_stopping_rounds=estop, seed=SEED, stratified=True) best_nrounds = res.shape[0] – estop best_nrounds = int(best_nrounds / 0.8) es decir: el número […]

Python Xgboost continuar la formación sobre el modelo existente

Digamos que construyo un modelo xgboost: bst = xgb.train(param0, dtrain1, num_round, evals=[(dtrain, “training”)]) Dónde: param0 es un conjunto de parámetros a xgb, dtrain1 es un DMatrix listo para ser entrenado num_round es el número de rondas Luego, guardo el modelo en el disco: bst.save_model(“xgbmodel”) Más adelante, quiero volver a cargar el modelo que guardé y […]

¿Cómo instalar xgboost en python en MacOS?

Soy un novato y aprendiendo python. ¿Puede alguien ayudarme? ¿Cómo instalar xgboost en python? Estoy usando Mac 10.11. Leí en línea e hice el siguiente paso, pero no pude descifrar qué hacer a continuación: pip install xgboost –

¿Xg boost para la clasificación multilabel?

¿Es posible usar xgboost para la clasificación multilabel? Ahora uso OneVsRestClassifier sobre GradientBoostingClassifier de sklearn. Funciona, pero usa solo un núcleo de mi CPU. En mis datos tengo ~ 45 características y la tarea es predecir unas 20 columnas con datos binarios (booleanos). La métrica es la media de la precisión (mapa @ 7). Si […]

Cómo obtener acceso a árboles individuales de un modelo xgboost en python / R

¿Cómo obtener acceso a árboles individuales de un modelo xgboost en python / R? A continuación estoy recibiendo de los árboles del bosque aleatorio de sklearn. estimator = RandomForestRegressor (oob_score = True, n_estimators = 10, max_features = ‘auto’) estimator.fit (tarning_data, traning_target) tree1 = estimator.estimators_ [0] leftChild = tree1.tree_.children_left rightChild = tree1.tree_.children_right

¿Cómo puedo instalar el paquete XGBoost en Python en Windows?

Intenté instalar el paquete XGBoost en Python. Estoy usando windows os, 64bits. He pasado por el siguiente. El directorio del paquete indica que xgboost es inestable para Windows y está deshabilitado: la instalación de pip en Windows está deshabilitada actualmente para futuras investigaciones, instale desde github. https://pypi.python.org/pypi/xgboost/ No estoy bien versado en Visual Studio, y […]

Importancia de la característica con XGBClassifier

Es de esperar que esté leyendo esto mal, pero en la documentación de la biblioteca de XGBoost, hay una nota de cómo extraer los atributos de importancia de las características utilizando feature_importances_ como el bosque aleatorio de sklearn. Sin embargo, por alguna razón, sigo recibiendo este error: AttributeError: ‘XGBClassifier’ object has no attribute ‘feature_importances_’ Mi […]