Articles of scipy

Cómo realizar una prueba t de una cola de dos muestras con numpy / scipy

En R , es posible realizar una prueba t de una cola de dos muestras simplemente usando > A = c(0.19826790, 1.36836629, 1.37950911, 1.46951540, 1.48197798, 0.07532846) > B = c(0.6383447, 0.5271385, 1.7721380, 1.7817880) > t.test(A, B, alternative=”greater”) Welch Two Sample t-test data: A and B t = -0.4189, df = 6.409, p-value = 0.6555 alternative […]

Valor de p de la estadística de prueba Chi cuadrado en Python

He calculado una estadística de prueba que se distribuye como un chi cuadrado con 1 grado de libertad, y quiero saber qué valor de P corresponde al uso de python. Soy un novato de python and maths / stats, así que creo que lo que quiero aquí es la función de denegación de probabilidad para […]

¿Cómo calcular de manera eficiente la gran multiplicación de matrices (características tfidf) en Python?

Actualmente quiero calcular la similitud de documentos de todos los pares utilizando la similitud de coseno y las características de Tfidf en python. Mi enfoque básico es el siguiente: from sklearn.feature_extraction.text import TfidfVectorizer #c = [doc1, doc2, …, docn] vec = TfidfVectorizer() X = vec.fit_transform(c) del vec Y = X * XT Funciona perfectamente bien, […]

Obtenga eficientemente índices de contenedores de histogtwigs en Python

Pregunta corta Tengo una imagen grande de 10000×10000 elementos, que se divide en unos pocos cientos de sectores / contenedores diferentes. Entonces necesito realizar algún cálculo iterativo en los valores contenidos dentro de cada bin. ¿Cómo extraigo los índices de cada bandeja para realizar mi cálculo de manera eficiente utilizando los valores de las ubicaciones? […]

¿Cuál es la diferencia entre (4,) y (4,1) para la forma en Numpy?

Tengo dos ndarray A y B , uno tiene la forma (4,) y otro (4,1) . Cuando quiero calcular la distancia del coseno usando esto , produce algunas excepciones que se quejan de que los dos objetos are not aligned ¿Alguien tiene ideas sobre esto? ¡Gracias!

Región de mayor densidad posterior y región central creíble

Dada una p posterior (Θ | D) sobre algunos parámetros Θ, se puede definir lo siguiente: Región de mayor densidad posterior: La región de densidad posterior más alta es el conjunto de valores más probables de que, en total, constituyen el 100 (1-α)% de la masa posterior. En otras palabras, para un α dado, buscamos […]

Python wilcoxon: desigual N

Rs wilcox.test puede tomar diferentes vectores de longitud, pero el wilcoxon de scipy.stats no puede: Recibo un mensaje de error unequal N . from scipy.stats import wilcoxon wilcoxon(range(10), range(12)) ¿Hay alguna manera de obtener el comportamiento de Rs en Python?

Ajuste de datos experimentales dentro de dos regiones diferentes

Estoy ajustando un conjunto de datos experimentales ( muestra ) dentro de dos regiones experimentales diferentes y se puede express con dos funciones matemáticas de la siguiente manera: 1ª región: y = m*x + c ( the slope can be constrained to zero) 2da región: y = d*exp(-k*x) los datos experimentales se muestran a continuación […]

¿Es posible usar números complejos como tags de destino en scikit learn?

Estoy tratando de usar sklearn para predecir una variable que representa la rotación. Debido al salto desafortunado de -pi a pi en los extremos de rotación, creo que un método mucho mejor sería usar un número complejo como objective. De esa manera, un error de 1 + 0.01j a 1-0.01j no es tan devastador. No […]

Generando una matriz densa a partir de una matriz dispersa en varios pitones

Tengo una base de datos Sqlite que contiene el siguiente tipo de esquema: termcount(doc_num, term , count) Esta tabla contiene términos con sus respectivas cuentas en el documento. me gusta (doc1 , term1 ,12) (doc1, term 22, 2) . . (docn,term1 , 10) Esta matriz puede considerarse como una matriz dispersa, ya que cada documento […]