Articles of scikit learn

Evaluación del modelo de regresión utilizando scikit-learn.

Estoy haciendo regresión con sklearn y uso la búsqueda aleatoria de cuadrícula para evaluar diferentes parámetros. Aquí hay un ejemplo de juguete: from sklearn.datasets import make_regression from sklearn.metrics import mean_squared_error, make_scorer from scipy.stats import randint as sp_randint from sklearn.ensemble import ExtraTreesRegressor from sklearn.cross_validation import LeaveOneOut from sklearn.grid_search import GridSearchCV, RandomizedSearchCV X, y = make_regression(n_samples=10, n_features=10, […]

¿Cómo funciona la estimación de la densidad del núcleo 2d en python (sklearn)?

Lo siento por la pregunta probablemente estúpida, pero ahora estoy intentando durante horas estimar una densidad a partir de un conjunto de datos 2D. Supongamos que mis datos sample = np.random.uniform(0,1,size=(50,2)) dados por la matriz: sample = np.random.uniform(0,1,size=(50,2)) . Solo quiero usar el paquete scipit scikit learn para estimar la densidad de la matriz de […]

método de ajuste en skthear python

Me estoy haciendo varias preguntas sobre el método de ajuste en sklearn. Pregunta 1: cuando hago: from sklearn.decomposition import TruncatedSVD model = TruncatedSVD() svd_1 = model.fit(X1) svd_2 = model.fit(X2) ¿Está cambiando el contenido del modelo variable durante el proceso? Pregunta 2: cuando hago: from sklearn.decomposition import TruncatedSVD model = TruncatedSVD() svd_1 = model.fit(X1) svd_2 = […]

Python scikit-learn KMeans se está matando (9) al calcular la puntuación de silueta

Actualmente estoy trabajando en un conjunto de datos de imágenes (250 000 imágenes, por lo tanto, tanto como los vectores de características, cada uno de ellos compuesto por 132 características) y tratando de usar la función KMeans proporcionada por sklearn. Lo ejecuto en Mac OS X 10.10, Python 2.7 y sklearn 0.15.2, y después de […]

¿Hay algún tipo de paquete de clúster subespacial disponible en scikit-learn?

¿Hay algún tipo de paquetes de clústeres subespaciales disponibles en scikit-learn?

Modelos de mezcla gaussiana del histogtwig de una imagen

Estoy intentando hacer una segmentación automática de imágenes de las diferentes regiones de una imagen 2D MR basada en valores de intensidad de píxel. El primer paso es implementar un Modelo de Mezcla Gaussiana en el histogtwig de la imagen. Necesito trazar el resultado gaussiano obtenido del método score_samples en el histogtwig. He intentado seguir […]

Error en la instalación de scikit-learn / no se encontraron números / faltan encabezados de números

Cuando bash instalar scikit-learn en un servidor Suse (openSuse 12.2 x86_64) a través de: pip install -U scikit-learn Obtuve el siguiente error: (….) compile options: ‘-I/usr/lib64/python2.7/site-packages/numpy/core/include -Isklearn/svm/src/libsvm -I/usr/lib64/python2.7/site-packages/numpy/core/include -I/usr/include/python2.7 -c’ gcc: sklearn/svm/libsvm.c sklearn/svm/libsvm.c:303:31: fatal error: numpy/arrayobject.h: No such file or directory comstacktion terminated. sklearn/svm/libsvm.c:303:31: fatal error: numpy/arrayobject.h: No such file or directory comstacktion terminated. Ya […]

¿Cómo calcular la matriz de término-documento?

Sé que Term-Document Matrix es una matriz matemática que describe la frecuencia de los términos que aparecen en una colección de documentos. En una matriz de términos de documentos, las filas corresponden a los documentos de la colección y las columnas corresponden a los términos. Estoy usando CountVectorizer de sklearn para extraer características de cadenas […]

¿Cuál es la diferencia entre el peso de la clase = ninguno y el auto en svm scikit learn?

En scikit learn svm classifier cuál es la diferencia entre class_weight = None y class_weight = Auto. A partir de la documentación se entrega como Establezca el parámetro C de la clase i en class_weight [i] * C para SVC. Si no se da, todas las clases se supone que tienen un peso uno. El […]

Mini entrenamiento de lotes de un clasificador scikit-learn donde proporciono los mini lotes

Tengo un conjunto de datos muy grande que no se puede cargar en la memoria. Quiero usar este conjunto de datos como conjunto de entrenamiento de un clasificador scikit-learn, por ejemplo, un LogisticRegression . ¿Existe la posibilidad de realizar un mini entrenamiento de lotes de un clasificador de scikit-learn donde ofrezco los mini lotes?