Articles of decision tree

Cómo explorar un árbol de decisiones construido usando scikit learn

Estoy construyendo un árbol de decisiones usando clf = tree.DecisionTreeClassifier() clf = clf.fit(X_train, Y_train) Todo esto funciona bien. Sin embargo, ¿cómo exploro el árbol de decisiones? Por ejemplo, ¿cómo encuentro qué entradas de X_train aparecen en una hoja en particular?

Implementando un árbol de decisiones usando h2o.

Estoy tratando de entrenar un modelo de árbol de decisión usando h2o. Soy consciente de que no existe una biblioteca específica para los árboles de decisión en h2o. Pero, h2o tiene una implementación de bosque aleatorio H2ORandomForestEstimator . ¿Podemos implementar un árbol de decisiones en h2o ajustando ciertos argumentos de entrada de bosques aleatorios? Porque […]

Python, PyDot y DecisionTree

Estoy intentando visualizar mi DecisionTree, pero obtengo el error El código es: X = [i[1:] for i in dataset]#attribute y = [i[0] for i in dataset] clf = tree.DecisionTreeClassifier() dot_data = StringIO() tree.export_graphviz(clf.fit(train_X, train_y), out_file=dot_data) graph = pydot.graph_from_dot_data(dot_data.getvalue()) graph.write_pdf(“tree.pdf”) Y el error es Traceback (most recent call last): if data.startswith(codecs.BOM_UTF8): TypeError: startswith first arg must […]

Usando sklearn, ¿cómo encuentro la profundidad de un árbol de decisión?

Estoy entrenando un árbol de decisión con sklearn. Cuando uso: dt_clf = tree.DecisionTreeClassifier() el parámetro max_depth defecto es None . De acuerdo con la documentación, si max_depth es None , entonces los nodos se expanden hasta que todas las hojas estén puras o hasta que todas las hojas contengan menos muestras de min_samples_split . Después […]

confundido acerca de random_state en el árbol de decisión de scikit learn

Confundido sobre el parámetro random_state , no estoy seguro de por qué el entrenamiento en el árbol de decisiones necesita algo de aleatoriedad. Mis pensamientos, (1) ¿está relacionado con un bosque aleatorio? (2) ¿Está relacionado con el conjunto de datos de pruebas de entrenamiento dividido? Si es así, ¿por qué no usar el método split […]

Python Comprobando las rutas a la hoja en el árbol binario python dando datos en la hoja

Digamos que tengo este árbol: cough Yes / \ No sneezing sneezing Yes / \ No Yes / \ No fever fever fever fever Yes / \ No Yes/ \No Yes / \ No Yes/ \No dead cold influenza cold dead influenza cold healthy Y quiero los caminos a la enfermedad “influenza” Lo que debería […]

Problemas al instalar graphviz para python3 en ubuntu 14.04

Quiero dibujar un árbol de decisión con python3. Sin embargo, solo puedo encontrar módulos para python2: graphviz , ete3 ¿Me ete3 algo? ¿Puedo usarlos con python3? ¿Conoces alguna otra posibilidad? Yo uso Ubuntu 14.04. Editar: sudo python3 -m pip install graphviz el comando sudo python3 -m pip install graphviz , pero aún no puedo encontrar […]

Analizar un archivo CSV usando python (para hacer un árbol de decisión más adelante)

En primer lugar, la divulgación completa: esto va hacia una asignación uni, por lo que no quiero recibir el código. :). Estoy más buscando enfoques; Soy muy nuevo en Python, después de haber leído un libro pero todavía no he escrito ningún código. La tarea completa es importar el contenido de un archivo CSV, crear […]

pydot: ¿es posible trazar dos nodos diferentes con la misma cadena en ellos?

Estoy usando pydot para dibujar gráficos en python. Me gustaría representar un árbol de decisiones, decir algo como (a1, a2, a3 son atributos y dos clases son 0 y 1: a1>3 / \ a2>10 a3>-7 / \ / \ 1 0 1 0 Sin embargo, al usar pydot, solo se crean dos hojas y el […]

¿Cómo encuentro en qué atributos se divide mi árbol cuando uso scikit-learn?

He estado explorando scikit-learn, haciendo árboles de decisión con criterios de división de entropía y gini, y explorando las diferencias. Mi pregunta es: ¿cómo puedo “abrir el capó” y descubrir exactamente qué atributos están dividiendo los árboles en cada nivel, junto con sus valores de información asociados, para poder ver dónde los dos criterios hacen […]