Tengo una matriz csc dispersa con muchos elementos cero para los que me gustaría calcular el producto de todos los elementos de columna para cada fila. es decir: A = [[1,2,0,0], [2,0,3,0]] debe ser convertido a: V = [[2, 6]] Usando una matriz densa numpy esto se puede lograr reemplazando todos los valores cero con […]
Quiero verificar si una matriz es positiva definida o semidefinita positiva usando Python. ¿Cómo puedo hacer eso? ¿Hay una función dedicada en SciPy para eso o en otros módulos?
Actualmente estoy intentando implementar la multiplicación básica de vectores matriciales en Cython (como parte de un proyecto mucho más grande para reducir la computación ) y encuentro que mi código es aproximadamente 2 Numpy.dot más lento que Numpy.dot . Me pregunto si hay algo que me estoy perdiendo que esté resultando en la desaceleración. Estoy […]
Estoy buscando ayuda para crear un sub-dataframe a partir de un dataframe existente usando una función similar a np.nansum. Quiero convertir esta tabla en una matriz de sums de columnas no nulas: dan ste bob t1 na 2 na t2 2 na 1 t3 2 1 na t4 1 na 2 t5 na 1 2 […]
Cómo generar una matriz para que sus entradas sean números reales aleatorios entre cero y uno inclusive con la restricción adicional: la sum de cada fila debe ser menor o igual que uno y la sum de cada columna debe ser menor o igual a uno. Ejemplos: matrix = [0.3, 0.4, 0.2; 0.7, 0.0, 0.3; […]
Dados dos arrays, A (forma: MXC) y B (forma: NXC), ¿hay una manera de restar cada fila de A de cada fila de B sin usar bucles? La salida final sería de forma (MNXC). Ejemplo A = np.array([[ 1, 2, 3], [100, 200, 300]]) B = np.array([[ 10, 20, 30], [1000, 2000, 3000], [ -10, […]
Preparo una matriz numpy y luego uso matplotlib para trazar la matriz, como por ejemplo: >>> import numpy >>> import matplotlib.pylab as plt >>> m = [[0.0, 1.47, 2.43, 3.44, 1.08, 2.83, 1.08, 2.13, 2.11, 3.7], [1.47, 0.0, 1.5, 2.39, 2.11, 2.4, 2.11, 1.1, 1.1, 3.21], [2.43, 1.5, 0.0, 1.22, 2.69, 1.33, 3.39, 2.15, 2.12, […]
Para almacenar gran matriz en el disco utilizo numpy.memmap. Aquí hay un código de ejemplo para probar la multiplicación de matrices grandes: import numpy as np import time rows= 10000 # it can be large for example 1kk cols= 1000 #create some data in memory data = np.arange(rows*cols, dtype=’float32′) data.resize((rows,cols)) #create file on disk fp0 […]
Estoy usando scikit-learn para la clasificación de documentos de texto (22000) en 100 clases. Utilizo el método de la matriz de confusión de scikit-learn para calcular la matriz de confusión. model1 = LogisticRegression() model1 = model1.fit(matrix, labels) pred = model1.predict(test_matrix) cm=metrics.confusion_matrix(test_labels,pred) print(cm) plt.imshow(cm, cmap=’binary’) Así es como se ve mi matriz de confusión: [[3962 325 […]
Actualmente quiero calcular la similitud de documentos de todos los pares utilizando la similitud de coseno y las características de Tfidf en python. Mi enfoque básico es el siguiente: from sklearn.feature_extraction.text import TfidfVectorizer #c = [doc1, doc2, …, docn] vec = TfidfVectorizer() X = vec.fit_transform(c) del vec Y = X * XT Funciona perfectamente bien, […]