Articles of agrupación de

Paquete Python para Spider Multi-Threaded w / Proxy Support?

En lugar de utilizar urllib, ¿alguien sabe cuál es el paquete más eficiente para la descarga rápida y multiproceso de URL que pueden operar a través de proxies http? Sé de algunos como Twisted, Scrapy, libcurl, etc., pero no sé lo suficiente sobre ellos para tomar una decisión o incluso si pueden usar proxies. ¿Alguien […]

Lista de grupos por valores

Digamos que tengo una lista como esta: list = [[“A”,0], [“B”,1], [“C”,0], [“D”,2], [“E”,2]] ¿Cómo puedo agrupar esto de la manera más elegante para obtener esta salida de lista en Python? list = [[“A”, “C”], [“B”], [“D”, “E”]] Por lo tanto, los valores se agrupan por el valor secundario pero el orden se conserva …

Elimine los valores atípicos (+/- 3 std) y reemplácelos con np.nan en Python / pandas

He visto varias soluciones que se acercan a resolver mi problema link1 link2 Pero hasta ahora no me han ayudado a tener éxito. Creo que la siguiente solución es lo que necesito, pero continúo recibiendo un error (y no tengo los puntos de reputación para comentarlo / hacer una pregunta): enlace (Recibo el siguiente error, […]

Creando sublistas

Lo contrario de la lista de aplanamiento. Dada una lista y una longitud n devuelve una lista de sublistas de longitud n. def sublist(lst, n): sub=[] ; result=[] for i in lst: sub+=[i] if len(sub)==n: result+=[sub] ; sub=[] if sub: result+=[sub] return result Un ejemplo: Si la lista es: [1,2,3,4,5,6,7,8] Y n es: 3 Regreso: […]

Pandas: elimina el grupo de los datos cuando un valor en el grupo cumple con una condición requerida

Tengo agrupaciones de valores en los datos y dentro de cada grupo, me gustaría verificar si un valor dentro del grupo es inferior a 8 . Si se cumple esta condición, todo el grupo se elimina del conjunto de datos. Tenga en cuenta que el valor al que me refiero se encuentra en otra columna […]

¿Rendir varios objetos a la vez a partir de un objeto iterable?

¿Cómo puedo producir varios elementos a la vez de un objeto iterable? Por ejemplo, con una secuencia de longitud arbitraria, ¿cómo puedo iterar a través de los elementos en la secuencia, en grupos de X elementos consecutivos por iteración?

¿Cómo usar groupby para concatenar cadenas en pandas python?

Actualmente tengo dataframe en la parte superior. ¿Hay una manera de usar una función groupby para obtener otro dataframe para agrupar los datos y concatenar las palabras en el formato como se muestra más abajo utilizando pandas de python? Gracias El

¿Cómo agrupar una lista de tuplas / objetos por índice / atributo similar en python?

Dada una lista old_list = [obj_1, obj_2, obj_3, …] Quiero crear una lista: new_list = [[obj_1, obj_2], [obj_3], …] donde obj_1.some_attr == obj_2.some_attr . Podría lanzar algunos for bucles y hacer cheques juntos, pero esto es feo. ¿Hay una forma pythonica para esto? por cierto, los atributos de los objetos son todas las cadenas. Alternativamente, […]