Articles of gradient descent

configurando un elemento de matriz con un error de secuencia en scikit learn GradientBoostingClassifier

Aquí está mi código, ¿alguien tiene alguna idea de lo que está mal? El error ocurre cuando lo llamo en fit , import pandas as pd import numpy as np from sklearn.ensemble import (RandomTreesEmbedding, RandomForestClassifier, GradientBoostingClassifier) from sklearn.model_selection import train_test_split from sklearn.feature_extraction.text import CountVectorizer n_estimators = 10 d = {‘f1’: [1, 2], ‘f2’: [‘foo goo’, […]

Gradiente de flujo tensor con respecto a la matriz.

Solo por contexto, estoy tratando de implementar un algoritmo de descenso de gradiente con Tensorflow. Tengo una matriz X [ x1 x2 x3 x4 ] [ x5 x6 x7 x8 ] que multiplico por algún vector de característica Y para obtener Z [ y1 ] Z = X [ y2 ] = [ z1 ] […]

Tensorflow: ¿Cómo escribir op con gradiente en python?

Me gustaría escribir una operación TensorFlow en python, pero me gustaría que sea diferenciable (para poder calcular un gradiente). Esta pregunta pregunta cómo escribir una operación en python, y la respuesta sugiere usar py_func (que no tiene gradiente): Tensorflow: escribiendo una operación en Python La documentación de TF describe cómo agregar una operación a partir […]

¿Por qué necesitamos llamar explícitamente a zero_grad ()?

¿Por qué necesitamos poner a cero explícitamente los gradientes en PyTorch? ¿Por qué no se pueden poner a cero los gradientes cuando se llama a loss.backward() ? ¿Qué escenario se presenta al mantener los gradientes en el gráfico y pedirle al usuario que ponga a cero explícitamente los gradientes?