calcular la distancia entre dos matrices numpy

Me interesaba calcular varias distancias espaciales entre dos matrices numpy (x e y).

http://docs.scipy.org/doc/scipy-0.14.0/reference/generated/scipy.spatial.distance.cdist.html

import numpy as np from scipy.spatial.distance import cdist x = np.array([[[1,2,3,4,5], [5,6,7,8,5], [5,6,7,8,5]], [[11,22,23,24,5], [25,26,27,28,5], [5,6,7,8,5]]]) i,j,k = x.shape xx = x.reshape(i,j*k).T y = np.array([[[31,32,33,34,5], [35,36,37,38,5], [5,6,7,8,5]], [[41,42,43,44,5], [45,46,47,48,5], [5,6,7,8,5]]]) yy = y.reshape(i,j*k).T results = cdist(xx,yy,'euclidean') print results 

Sin embargo, los resultados anteriores producen demasiados resultados no deseados. ¿Cómo puedo limitarlo solo para mis resultados requeridos?

Quiero calcular la distancia entre [1,11] y [31,41]; [2,22] y [32,42], … y así sucesivamente.

Si solo desea las distancias entre cada par de puntos, entonces no necesita calcular una matriz de distancia completa.

En su lugar, calcularlo directamente:

 import numpy as np x = np.array([[[1,2,3,4,5], [5,6,7,8,5], [5,6,7,8,5]], [[11,22,23,24,5], [25,26,27,28,5], [5,6,7,8,5]]]) y = np.array([[[31,32,33,34,5], [35,36,37,38,5], [5,6,7,8,5]], [[41,42,43,44,5], [45,46,47,48,5], [5,6,7,8,5]]]) xx = x.reshape(2, -1) yy = y.reshape(2, -1) dist = np.hypot(*(xx - yy)) print dist 

Para explicar un poco más sobre lo que está sucediendo, primero cambiamos la forma de los arreglos para que tengan una forma 2xN ( -1 es un marcador de posición que le dice a Numpy que calcule el tamaño correcto a lo largo de ese eje automáticamente):

 In [2]: x.reshape(2, -1) Out[2]: array([[ 1, 2, 3, 4, 5, 5, 6, 7, 8, 5, 5, 6, 7, 8, 5], [11, 22, 23, 24, 5, 25, 26, 27, 28, 5, 5, 6, 7, 8, 5]]) 

Por lo tanto, cuando restamos xx y yy , obtendremos una matriz 2xN:

 In [3]: xx - yy Out[3]: array([[-30, -30, -30, -30, 0, -30, -30, -30, -30, 0, 0, 0, 0, 0, 0], [-30, -20, -20, -20, 0, -20, -20, -20, -20, 0, 0, 0, 0, 0, 0]]) 

Luego podemos descomprimir esto en los componentes dx y dy :

 In [4]: dx, dy = xx - yy In [5]: dx Out[5]: array([-30, -30, -30, -30, 0, -30, -30, -30, -30, 0, 0, 0, 0, 0, 0]) In [6]: dy Out[6]: array([-30, -20, -20, -20, 0, -20, -20, -20, -20, 0, 0, 0, 0, 0, 0]) 

Y calcule la distancia ( np.hypot es equivalente a np.sqrt(dx**2 + dy**2) ):

 In [7]: np.hypot(dx, dy) Out[7]: array([ 42.42640687, 36.05551275, 36.05551275, 36.05551275, 0. , 36.05551275, 36.05551275, 36.05551275, 36.05551275, 0. , 0. , 0. , 0. , 0. , 0. ]) 

O podemos tener el desempaquetado hecho automáticamente y hacerlo todo en un solo paso:

 In [8]: np.hypot(*(xx - yy)) Out[8]: array([ 42.42640687, 36.05551275, 36.05551275, 36.05551275, 0. , 36.05551275, 36.05551275, 36.05551275, 36.05551275, 0. , 0. , 0. , 0. , 0. , 0. ]) 

Si desea calcular otros tipos de distancias, simplemente cambie np.hypot a la función que desea utilizar. Por ejemplo, para las distancias Manhattan / ciudad-bloque:

 In [9]: dist = np.sum(np.abs(xx - yy), axis=0) In [10]: dist Out[10]: array([60, 50, 50, 50, 0, 50, 50, 50, 50, 0, 0, 0, 0, 0, 0])