Articles of matrix

Multiplicando elementos de columna de matriz dispersa.

Tengo una matriz csc dispersa con muchos elementos cero para los que me gustaría calcular el producto de todos los elementos de columna para cada fila. es decir: A = [[1,2,0,0], [2,0,3,0]] debe ser convertido a: V = [[2, 6]] Usando una matriz densa numpy esto se puede lograr reemplazando todos los valores cero con […]

Compruebe si hay definición positiva o semidefinitud positiva

Quiero verificar si una matriz es positiva definida o semidefinita positiva usando Python. ¿Cómo puedo hacer eso? ¿Hay una función dedicada en SciPy para eso o en otros módulos?

¿Qué está causando la desaceleración 2x ​​en mi implementación de Cython de la multiplicación de vectores matriciales?

Actualmente estoy intentando implementar la multiplicación básica de vectores matriciales en Cython (como parte de un proyecto mucho más grande para reducir la computación ) y encuentro que mi código es aproximadamente 2 Numpy.dot más lento que Numpy.dot . Me pregunto si hay algo que me estoy perdiendo que esté resultando en la desaceleración. Estoy […]

Pandas crosstab matrix dot nansum

Estoy buscando ayuda para crear un sub-dataframe a partir de un dataframe existente usando una función similar a np.nansum. Quiero convertir esta tabla en una matriz de sums de columnas no nulas: dan ste bob t1 na 2 na t2 2 na 1 t3 2 1 na t4 1 na 2 t5 na 1 2 […]

¿Cómo generar una matriz con entradas aleatorias y con restricciones en filas y columnas?

Cómo generar una matriz para que sus entradas sean números reales aleatorios entre cero y uno inclusive con la restricción adicional: la sum de cada fila debe ser menor o igual que uno y la sum de cada columna debe ser menor o igual a uno. Ejemplos: matrix = [0.3, 0.4, 0.2; 0.7, 0.0, 0.3; […]

Resta cada fila de la matriz A de cada fila de la matriz B sin bucles

Dados dos arrays, A (forma: MXC) y B (forma: NXC), ¿hay una manera de restar cada fila de A de cada fila de B sin usar bucles? La salida final sería de forma (MNXC). Ejemplo A = np.array([[ 1, 2, 3], [100, 200, 300]]) B = np.array([[ 10, 20, 30], [1000, 2000, 3000], [ -10, […]

Matplotlib plot numpy matriz como índice 0

Preparo una matriz numpy y luego uso matplotlib para trazar la matriz, como por ejemplo: >>> import numpy >>> import matplotlib.pylab as plt >>> m = [[0.0, 1.47, 2.43, 3.44, 1.08, 2.83, 1.08, 2.13, 2.11, 3.7], [1.47, 0.0, 1.5, 2.39, 2.11, 2.4, 2.11, 1.1, 1.1, 3.21], [2.43, 1.5, 0.0, 1.22, 2.69, 1.33, 3.39, 2.15, 2.12, […]

Numpy eficiente gran matriz de multiplicación

Para almacenar gran matriz en el disco utilizo numpy.memmap. Aquí hay un código de ejemplo para probar la multiplicación de matrices grandes: import numpy as np import time rows= 10000 # it can be large for example 1kk cols= 1000 #create some data in memory data = np.arange(rows*cols, dtype=’float32′) data.resize((rows,cols)) #create file on disk fp0 […]

¿Cómo puedo trazar una matriz de confusión?

Estoy usando scikit-learn para la clasificación de documentos de texto (22000) en 100 clases. Utilizo el método de la matriz de confusión de scikit-learn para calcular la matriz de confusión. model1 = LogisticRegression() model1 = model1.fit(matrix, labels) pred = model1.predict(test_matrix) cm=metrics.confusion_matrix(test_labels,pred) print(cm) plt.imshow(cm, cmap=’binary’) Así es como se ve mi matriz de confusión: [[3962 325 […]

¿Cómo calcular de manera eficiente la gran multiplicación de matrices (características tfidf) en Python?

Actualmente quiero calcular la similitud de documentos de todos los pares utilizando la similitud de coseno y las características de Tfidf en python. Mi enfoque básico es el siguiente: from sklearn.feature_extraction.text import TfidfVectorizer #c = [doc1, doc2, …, docn] vec = TfidfVectorizer() X = vec.fit_transform(c) del vec Y = X * XT Funciona perfectamente bien, […]