Articles of Machine Learning

Donde se define el módulo de capa en PyCaffe

Estoy modificando un tutorial de Caffe para implementar una neural network, pero me cuesta identificar dónde se ubican algunos de los módulos de pycaffe para ver ciertas definiciones de funciones. Por ejemplo, el tutorial menciona: import caffe from caffe import layers a L, params as P …. L.Convolution(bottom, kernel_size=ks, stride=stride, num_output=nout, pad=pad, group=group) L.InnerProduct(bottom, num_output=nout) […]

Implementando el modelo de tema con Python (numpy)

Recientemente, implementé el modelo Gibbs de muestreo para LDA en Python usando numpy, tomando como referencia algún código de un sitio. En cada iteración del muestreo de Gibbs, eliminamos una palabra (actual), muestreamos un nuevo tema para esa palabra de acuerdo con una distribución de probabilidad condicional posterior inferida del modelo LDA, y actualizamos los […]

Scikit-learn: cómo calcular el verdadero negativo

Estoy usando Scikit-learning y necesito calcular el Verdadero Positivo (TP), el Falso Positivo (FP), el Verdadero Negativo (TN) y el Falso Negativo (FN) de una matriz de confusión como esta: [[2 0 3 4] [0 4 5 1] [1 0 3 2] [5 0 0 4]] Sé cómo calcular el TP, el FP y el […]

GradientBoostingClassifier con un BaseEstimator en scikit-learn?

Intenté usar GradientBoostingClassifier en scikit-learn y funciona bien con sus parámetros predeterminados. Sin embargo, cuando intenté reemplazar el BaseEstimator con un clasificador diferente, no funcionó y me dio el siguiente error: return y – np.nan_to_num(np.exp(pred[:, k] – IndexError: too many indices ¿Tienes alguna solución para el problema? Este error se puede regenerar utilizando los siguientes […]

Terminación de la matriz en Python

Digamos que tengo una matriz: > import numpy as nap > a = np.random.random((5,5)) array([[ 0.28164485, 0.76200749, 0.59324211, 0.15201506, 0.74084168], [ 0.83572213, 0.63735993, 0.28039542, 0.19191284, 0.48419414], [ 0.99967476, 0.8029097 , 0.53140614, 0.24026153, 0.94805153], [ 0.92478 , 0.43488547, 0.76320656, 0.39969956, 0.46490674], [ 0.83315135, 0.94781119, 0.80455425, 0.46291229, 0.70498372]]) Y que hago algunos agujeros con np.NaN , por […]

Predecir cuánto tiempo tardará en ejecutarse una clasificación de scikit-learn

¿Hay alguna forma de predecir cuánto tiempo tomará ejecutar un clasificador desde sci-kit learn según los parámetros y el conjunto de datos? Lo sé, bastante meta, ¿verdad? Algunas clasificaciones / combinaciones de parámetros son bastante rápidas, y otras toman tanto tiempo que eventualmente acabo con el proceso. Me gustaría una manera de estimar por adelantado […]

¿Ecuación normal y numpy ‘mínimos cuadrados’, ‘resolver’ métodos de diferencia en la regresión?

Estoy haciendo regresión lineal con múltiples variables / características. Intento obtener tetas (coeficientes) utilizando el método de ecuación normal (que usa matriz inversa), la herramienta numpy.linalg.lstsq de numpy de mínimos cuadrados y la herramienta np.linalg.solve . En mis datos tengo n = 143 características y m = 13000 ejemplos de entrenamiento. Para el método de […]

String Subsequence Kernel y SVM usando Python

¿Cómo puedo usar Subsequence String Kernel (SSK) [Lodhi 2002] para entrenar un SVM (Support Vector Machine) en Python?

¿Cómo implementar el descenso de gradiente de mini lotes en python?

Acabo de empezar a aprender el aprendizaje profundo. Me encontré atascado cuando se trataba de pendiente de gradiente. Sé cómo implementar el descenso de gradiente por lotes. Sé cómo funciona tan bien cómo funcionan en teoría los mini-lotes y el descenso de gradiente estocástico. Pero realmente no puedo entender cómo implementar en código. import numpy […]

¿Cuántas características puede manejar scikit-learn?

Tengo un archivo csv de [66k, 56k] tamaño (filas, columnas). Es una matriz dispersa. Sé que numpy puede manejar ese tamaño de una matriz. Me gustaría saber, de acuerdo con la experiencia de todos, ¿cuántas características pueden manejar cómodamente los algoritmos de scikit-learn?