Estoy tratando de obtener los elementos n-th de una lista de tuplas.
Tengo algo como:
elements = [(1,1,1),(2,3,7),(3,5,10)]
Deseo extraer solo los segundos elementos de cada tupla en una lista:
seconds = [1, 3, 5]
Sé que podría hacerse con un bucle for
pero quería saber si hay otra forma, ya que tengo miles de tuplas.
n = 1 # N. . . [x[n] for x in elements]
Sé que podría hacerse con un FOR, pero quería saber si hay otra manera
Hay otra manera. También puedes hacerlo con map y itemgetter :
>>> from operator import itemgetter >>> map(itemgetter(1), elements)
Sin embargo, esto sigue realizando un bucle internamente y es un poco más lento que la comprensión de la lista:
setup = 'elements = [(1,1,1) for _ in range(100000)];from operator import itemgetter' method1 = '[x[1] for x in elements]' method2 = 'map(itemgetter(1), elements)' import timeit t = timeit.Timer(method1, setup) print('Method 1: ' + str(t.timeit(100))) t = timeit.Timer(method2, setup) print('Method 2: ' + str(t.timeit(100)))
Resultados:
Método 1: 1.25699996948 Método 2: 1.46600008011
Si necesita iterar sobre una lista, usar una for
está bien.
Esto también funciona:
zip(*elements)[1]
(Estoy publicando principalmente esto, para demostrarme a mí mismo que he empalado zip
…)
Véalo en acción:
>>> help(zip)
Ayuda en función incorporada zip en módulo incorporado :
cremallera(…)
zip (seq1 [, seq2 […]]) -> [(seq1 [0], seq2 [0] …), (…)]
Devuelva una lista de tuplas, donde cada tupla contiene el elemento i-th de cada una de las secuencias de argumentos. La lista devuelta se trunca en longitud a la longitud de la secuencia de argumentos más corta.
>>> elements = [(1,1,1),(2,3,7),(3,5,10)] >>> zip(*elements) [(1, 2, 3), (1, 3, 5), (1, 7, 10)] >>> zip(*elements)[1] (1, 3, 5) >>>
Lo bueno que aprendí hoy: usar *list
en argumentos para crear una lista de parámetros para una función …
Nota : en Python3, zip
devuelve un iterador, así que en su lugar use list(zip(*elements))
para devolver una lista de tuplas.
Encontré esto mientras buscaba de qué manera es más rápido extraer el segundo elemento de una lista de 2 tuplas. No es lo que quería, pero ejecuté la misma prueba que se muestra con un tercer método más una prueba del método zip
setup = 'elements = [(1,1) for _ in range(100000)];from operator import itemgetter' method1 = '[x[1] for x in elements]' method2 = 'map(itemgetter(1), elements)' method3 = 'dict(elements).values()' method4 = 'zip(*elements)[1]' import timeit t = timeit.Timer(method1, setup) print('Method 1: ' + str(t.timeit(100))) t = timeit.Timer(method2, setup) print('Method 2: ' + str(t.timeit(100))) t = timeit.Timer(method3, setup) print('Method 3: ' + str(t.timeit(100))) t = timeit.Timer(method4, setup) print('Method 4: ' + str(t.timeit(100))) Method 1: 0.618785858154 Method 2: 0.711684942245 Method 3: 0.298138141632 Method 4: 1.32586884499
Entonces, más del doble de rápido si tiene un par de 2 tuplas para convertir simplemente a un dict y tomar los valores.
map (lambda x:(x[1]),elements)
Tiempos para Python 3.6 para extraer el segundo elemento de una lista de 2 tuplas.
Además, se agregó el método de matriz numpy
, que es más fácil de leer (pero podría decirse que es más simple que la comprensión de la lista).
from operator import itemgetter elements = [(1,1) for _ in range(100000)] %timeit second = [x[1] for x in elements] %timeit second = list(map(itemgetter(1), elements)) %timeit second = dict(elements).values() %timeit second = list(zip(*elements))[1] %timeit second = np.array(elements)[:,1]
y los tiempos:
list comprehension: 4.73 ms ± 206 µs per loop list(map): 5.3 ms ± 167 µs per loop dict: 2.25 ms ± 103 µs per loop list(zip) 5.2 ms ± 252 µs per loop numpy array: 28.7 ms ± 1.88 ms per loop
Tenga en cuenta que map()
y zip()
ya no devuelven una lista, de ahí la conversión explícita.
Usando islice
y chain.from_iterable
:
>>> from itertools import chain, islice >>> elements = [(1,1,1),(2,3,7),(3,5,10)] >>> list(chain.from_iterable(islice(item, 1, 2) for item in elements)) [1, 3, 5]
Esto puede ser útil cuando necesitas más de un elemento:
>>> elements = [(0, 1, 2, 3, 4, 5), (10, 11, 12, 13, 14, 15), (20, 21, 22, 23, 24, 25)] >>> list(chain.from_iterable(islice(tuple_, 2, 5) for tuple_ in elements)) [2, 3, 4, 12, 13, 14, 22, 23, 24]