Articles of agrupación de

Dividiendo nodos conectados en grupos de tres

Tengo una colección de objetos (los llamaré nodos) que están conectados entre sí. Cada nodo está conectado al menos a otro nodo, y la colección completa de nodos es un gran blob (sin valores atípicos). El número de nodos es un múltiplo de tres. Lo que quiero hacer es dividir los nodos en grupos de […]

Crea grupos superpuestos con pandas timegrouper

Estoy usando Pandas Timegrouper para agrupar puntos de datos en un dataframe de pandas en python: grouped = data.groupby(pd.TimeGrouper(’30S’)) Me gustaría saber si hay una manera de lograr la superposición de ventanas, como se sugiere en esta pregunta: Superposición de ventanas en Pandas mientras se mantiene el dataframe de pandas como estructura de datos. Actualización: […]

¿Eliminar los nombres de usuario de un dataframe que no aparecen un número determinado de veces?

Estoy tratando de entender lo que se proporciona a continuación (que encontré en línea, pero no entiendo completamente). Básicamente, quiero eliminar los nombres de usuario que no aparecen en mi dataframe al menos 4 veces (aparte de eliminar estos nombres, no quiero modificar el dataframe de ninguna otra manera). ¿El siguiente código resuelve este problema […]

Python, multiproceso demasiado lento, multiproceso

Soy un novato de multiprocesamiento, Sé algo sobre el enhebrado, pero necesito boost la velocidad de este cálculo, con suerte con el multiprocesamiento: Descripción de ejemplo: envía una cadena a un hilo, altera una prueba de cadena + referencia, envía el resultado de vuelta para imprimir. from threading import Thread class Alter(Thread): def __init__(self, word): […]

Agrupar objetos para lograr una propiedad media similar para todos los grupos.

Tengo una colección de objetos, cada uno de los cuales tiene un “peso” numérico. Me gustaría crear grupos de estos objetos de manera que cada grupo tenga aproximadamente la misma media aritmética de pesos de objetos. Los grupos no necesariamente tendrán el mismo número de miembros, pero el tamaño de los grupos estará uno dentro […]

¿Cómo obtener la cantidad de “trabajo” que queda por hacer en un Pool de multiprocesamiento de Python?

Hasta ahora, siempre que necesitaba utilizar el multiprocessing lo he hecho creando manualmente un “grupo de procesos” y compartiendo una Cola de trabajo con todos los subprocesos. Por ejemplo: from multiprocessing import Process, Queue class MyClass: def __init__(self, num_processes): self._log = logging.getLogger() self.process_list = [] self.work_queue = Queue() for i in range(num_processes): p_name = ‘CPU_%02d’ […]

Pandas – Groupby y crear nuevos DataFrame?

Esta es mi situacion In[1]: data Out[1]: Item Type 0 Orange Edible, Fruit 1 Banana Edible, Fruit 2 Tomato Edible, Vegetable 3 Laptop Non Edible, Electronic In[2]: type(data) Out[2]: pandas.core.frame.DataFrame Lo que quiero hacer es crear un dataframe de solo Fruits , por lo que debo groupby tal manera que Fruit exista en Type . […]

Agrupando los mismos elementos recurrentes que ocurren en una fila de la lista

Por ejemplo, tenemos una lista como esta: L = [“item1”, “item2”, “item3”, “item3”, “item3”, “item1”, “item2”, “item4”, “item4”, “item4”] Quiero empaquetarlos en la lista de tuplas de la forma: [(“item1”, 1), (“item2”, 1), (“item3”, 3),… (“item1”, 1)] Ya he desarrollado un algoritmo que hace algo similar, para obtener: {item1: 2, item2: 2, …} (Encuentra todas […]

Python equivalente a R “split” -function

En R, puedes dividir un vector según los factores de otro vector: > a b split(a,b) $`1` [1] 1 3 5 7 9 $`2` [1] 2 4 6 8 10 Así, agrupando una lista (en términos de python) de acuerdo con los valores de otra lista (de acuerdo con el orden de los factores). ¿Hay […]

¿Una receta para agrupar / agregar datos?

Tengo algunos datos almacenados en una lista que me gustaría agrupar según un valor. Por ejemplo, si mis datos son data = [(1, ‘a’), (2, ‘x’), (1, ‘b’)] y quiero agruparlo por el primer valor en cada tupla para obtener result = [(1, ‘ab’), (2, ‘x’)] ¿Cómo lo haría? De manera más general, ¿cuál es […]