Articles of aprendizaje

¿Cómo manejar variables categóricas en sklearn GradientBoostingClassifier?

Estoy intentando entrenar modelos con GradientBoostingClassifier usando variables categóricas. El siguiente es un ejemplo de código primitivo, solo para intentar ingresar variables categóricas en GradientBoostingClassifier . from sklearn import datasets from sklearn.ensemble import GradientBoostingClassifier import pandas iris = datasets.load_iris() # Use only data for 2 classes. X = iris.data[(iris.target==0) | (iris.target==1)] Y = iris.target[(iris.target==0) | […]

¿Cómo obtener mini-lotes en pytorch de forma limpia y eficiente?

Estaba tratando de hacer una cosa simple que era entrenar un modelo lineal con Estocástica Gradiente Descenso (SGD) utilizando antorcha: import numpy as np import torch from torch.autograd import Variable import pdb def get_batch2(X,Y,M,dtype): X,Y = X.data.numpy(), Y.data.numpy() N = len(Y) valid_indices = np.array( range(N) ) batch_indices = np.random.choice(valid_indices,size=M,replace=False) batch_xs = torch.FloatTensor(X[batch_indices,:]).type(dtype) batch_ys = torch.FloatTensor(Y[batch_indices]).type(dtype) […]

AttributeError: el objeto ‘GridSearchCV’ no tiene atributo ‘cv_results_’

Intento aplicar este código: pipe = make_pipeline(TfidfVectorizer(min_df=5), LogisticRegression()) param_grid = {‘logisticregression__C’: [ 0.001, 0.01, 0.1, 1, 10, 100], “tfidfvectorizer__ngram_range”: [(1, 1),(1, 2),(1, 3)]} grid = GridSearchCV(pipe, param_grid, cv=5) grid.fit(text_train, Y_train) scores = grid.cv_results_[‘mean_test_score’].reshape(-1, 3).T # visualize heat map heatmap = mglearn.tools.heatmap( scores, xlabel=”C”, ylabel=”ngram_range”, cmap=”viridis”, fmt=”%.3f”, xticklabels=param_grid[‘logisticregression__C’], yticklabels=param_grid[‘tfidfvectorizer__ngram_range’]) plt.colorbar(heatmap) Pero tengo este error: AttributeError: ‘GridSearchCV’ […]

¿Algún clasificador bayesiano ingenuo en python?

He probado el marco naranja para la clasificación bayesiana ingenua. Los métodos son extremadamente poco intuitivos y la documentación es extremadamente desorganizada. ¿Alguien aquí tiene otro marco para recomendar? Utilizo principalmente NaiveBayesian por ahora. Estaba pensando en usar NaiveClassification de nltk pero luego no creen que puedan manejar variables continuas. ¿Cuáles son mis opciones?

Vectorización: No es una colección válida.

Quiero vectorizar un archivo txt que contenga mi corpus de entrenamiento para el clasificador OneClassSVM. Para eso estoy usando CountVectorizer de la biblioteca scikit-learn. Aquí está debajo de mi código: def file_to_corpse(file_name, stop_words): array_file = [] with open(file_name) as fd: corp = fd.readlines() array_file = np.array(corp) stwf = stopwords.words(‘french’) for w in stop_words: stwf.append(w) vectorizer […]

La conversión del modelo Core ML falla con “No se puede inferir el nombre y las dimensiones de entrada”

Estoy tratando de hacer un modelo Core ML de Places205 – GoogLeNet, como lo describe Apple aquí . No quiero usar el modelo prefabricado de Apple, así que obtuve el modelo original de este enlace: https://developer.apple.com/machine-learning/model-details/Places205-GoogLeNet.txt Según la sesión WWDC de Apple, podemos convertir ese modelo usando Coremltools. En su sesión no sabemos qué IDE […]

¿La mejor manera de salvar un modelo entrenado en PyTorch?

Estaba buscando formas alternativas de salvar un modelo entrenado en PyTorch. Hasta ahora, he encontrado dos alternativas. torch.save () para guardar un modelo y torch.load () para cargar un modelo. model.state_dict () para guardar un modelo entrenado y model.load_state_dict () para cargar el modelo guardado. He llegado a esta discusión donde se recomienda el enfoque […]

Restaurar variables específicas de TensorFlow a una capa específica (Restaurar por nombre)

Supongamos que entrené un modelo TensorFlow y lo guardé, ahora tengo un modelo diferente, y quiero usar algunos de los pesos en el modelo guardado para algunas de las capas de mi modelo (tienen la misma forma). Ahora, pude encontrar cómo guardar variables específicas de un modelo (con nombres específicos) pero no pude encontrar ningún […]

Cómo instalar la versión de tensorflow GPU en VirtualBox Ubuntu OS. Y el sistema operativo host es Windows 10

Quiero configurar el entorno para el aprendizaje profundo utilizando Anaconda (python 3.6). Tengo un sistema que tiene nvidia get force 1060 con ventanas instaladas en él. Ahora quiero tener Ubuntu OS en VB. ¿Puedo instalar las bibliotecas Cuda y CuDNN en el sistema operativo Ubuntu basado en VB? ¿Alguien que pueda ayudarme?

Significado de los parámetros de tensorflow variable_scope de Tensorflow

Actualmente estoy leyendo un código fuente para una biblioteca delgada que se basa en Tensorflow y usan el argumento de los values para el método variable_scope , como aquí . Desde la página de la API puedo ver: Este administrador de contexto valida que los valores (opcionales) son del mismo gráfico, garantiza que el gráfico […]