Articles of agrupación de

Agrupando los mismos elementos recurrentes que ocurren en una fila de la lista

Por ejemplo, tenemos una lista como esta: L = [“item1”, “item2”, “item3”, “item3”, “item3”, “item1”, “item2”, “item4”, “item4”, “item4”] Quiero empaquetarlos en la lista de tuplas de la forma: [(“item1”, 1), (“item2”, 1), (“item3”, 3),… (“item1”, 1)] Ya he desarrollado un algoritmo que hace algo similar, para obtener: {item1: 2, item2: 2, …} (Encuentra todas […]

Python equivalente a R “split” -function

En R, puedes dividir un vector según los factores de otro vector: > a b split(a,b) $`1` [1] 1 3 5 7 9 $`2` [1] 2 4 6 8 10 Así, agrupando una lista (en términos de python) de acuerdo con los valores de otra lista (de acuerdo con el orden de los factores). ¿Hay […]

¿Una receta para agrupar / agregar datos?

Tengo algunos datos almacenados en una lista que me gustaría agrupar según un valor. Por ejemplo, si mis datos son data = [(1, ‘a’), (2, ‘x’), (1, ‘b’)] y quiero agruparlo por el primer valor en cada tupla para obtener result = [(1, ‘ab’), (2, ‘x’)] ¿Cómo lo haría? De manera más general, ¿cuál es […]

Lista de resultados de Groupby en grupos vacíos.

Estaba jugando para sentir mejor el grupo de groupby , así que groupby una lista de tuplas por el número y traté de obtener una lista de los grupos resultantes. Sin embargo, cuando convierto el resultado de groupby a una lista, obtengo un resultado extraño: todos, excepto el último grupo, están vacíos. ¿Porqué es eso? […]

¿Controlando la prioridad de progtwigción de los hilos de python?

He escrito una secuencia de comandos que utiliza dos grupos de subprocesos de diez subprocesos cada uno para extraer datos de una API. El grupo de subprocesos implementa este código en ActiveState . Cada grupo de subprocesos está supervisando una base de datos Redis a través de PubSub para nuevas entradas. Cuando se publica una […]

Paquete Python para Spider Multi-Threaded w / Proxy Support?

En lugar de utilizar urllib, ¿alguien sabe cuál es el paquete más eficiente para la descarga rápida y multiproceso de URL que pueden operar a través de proxies http? Sé de algunos como Twisted, Scrapy, libcurl, etc., pero no sé lo suficiente sobre ellos para tomar una decisión o incluso si pueden usar proxies. ¿Alguien […]

Lista de grupos por valores

Digamos que tengo una lista como esta: list = [[“A”,0], [“B”,1], [“C”,0], [“D”,2], [“E”,2]] ¿Cómo puedo agrupar esto de la manera más elegante para obtener esta salida de lista en Python? list = [[“A”, “C”], [“B”], [“D”, “E”]] Por lo tanto, los valores se agrupan por el valor secundario pero el orden se conserva …

Elimine los valores atípicos (+/- 3 std) y reemplácelos con np.nan en Python / pandas

He visto varias soluciones que se acercan a resolver mi problema link1 link2 Pero hasta ahora no me han ayudado a tener éxito. Creo que la siguiente solución es lo que necesito, pero continúo recibiendo un error (y no tengo los puntos de reputación para comentarlo / hacer una pregunta): enlace (Recibo el siguiente error, […]

Creando sublistas

Lo contrario de la lista de aplanamiento. Dada una lista y una longitud n devuelve una lista de sublistas de longitud n. def sublist(lst, n): sub=[] ; result=[] for i in lst: sub+=[i] if len(sub)==n: result+=[sub] ; sub=[] if sub: result+=[sub] return result Un ejemplo: Si la lista es: [1,2,3,4,5,6,7,8] Y n es: 3 Regreso: […]

Pandas: elimina el grupo de los datos cuando un valor en el grupo cumple con una condición requerida

Tengo agrupaciones de valores en los datos y dentro de cada grupo, me gustaría verificar si un valor dentro del grupo es inferior a 8 . Si se cumple esta condición, todo el grupo se elimina del conjunto de datos. Tenga en cuenta que el valor al que me refiero se encuentra en otra columna […]