Articles of conjunto de

¿Cómo puedo encontrar la intersección de dos archivos grandes de manera eficiente utilizando Python?

Tengo dos archivos grandes. Su contenido se ve así: 134430513 125296589 151963957 125296589 El archivo contiene una lista de ids sin clasificar. Algunos identificadores pueden aparecer más de una vez en un solo archivo. Ahora quiero encontrar la parte de la intersección de dos archivos. Es decir, los identificadores aparecen en ambos archivos. Acabo de […]

Python: Elementos únicos de lista en el orden en que aparecen.

En Python, podemos obtener los elementos únicos de la lista usando set(list) . Sin embargo, al hacer esto se rompe el orden en que aparecen los valores en la lista original. ¿Existe una manera elegante de obtener los elementos únicos en el orden en que aparecen en la lista?

Aplicar una función de pares en una serie de pandas.

Tengo una serie de pandas cuyos elementos constituyen frozensets: data = {0: frozenset({‘apple’, ‘banana’}), 1: frozenset({‘apple’, ‘orange’}), 2: frozenset({‘banana’}), 3: frozenset({‘kumquat’, ‘orange’}), 4: frozenset({‘orange’}), 5: frozenset({‘orange’, ‘pear’}), 6: frozenset({‘orange’, ‘pear’}), 7: frozenset({‘apple’, ‘banana’, ‘pear’}), 8: frozenset({‘banana’, ‘persimmon’}), 9: frozenset({‘apple’}), 10: frozenset({‘banana’}), 11: frozenset({‘apple’})} tokens = pd.Series(data); tokens 0 (apple, banana) 1 (orange, apple) 2 (banana) […]

Crea un conjunto a partir de una lista usando {}

A veces tengo una lista y quiero hacer algunas acciones con ella. Lo que hago es escribir cosas como: >>> mylist = [1,2,3] >>> myset = set(mylist) {1, 2, 3} Hoy descubrí que desde Python 2.7 también puedes definir un conjunto diciendo directamente {1,2,3} , y parece ser una forma equivalente de definirlo. Entonces, me […]

¿Es más rápido unir conjuntos o verificar la lista completa en busca de un duplicado?

Lo siento por el título mal redactado, pero antes hice una pregunta sobre cómo obtener una lista única de artículos de dos listas. La gente me dijo que hiciera la lista -> conjuntos y luego unión. Así que ahora me pregunto si es más rápido: Mientras agrega un elemento a una lista, escanee la lista […]

¿Por qué el filtro de Python (predicado, conjunto) no devuelve un conjunto?

¿Por qué se diseñó el filter de Python de modo que si ejecuta el filter(my_predicate, some_set) , obtengo un retorno de objeto de list que un objeto de set ? ¿Hay casos prácticos en los que no desearía que el resultado fuera un set …?

Usa frozenset como un par en python

Me gustaría hacer un par de dos elementos. No me importa el orden de los elementos, así que uso frozenset . Puedo pensar en los siguientes dos métodos para repetir los elementos del frozenset. ¿No hay algún método más sofisticado? Gracias por adelantado. pair = frozenset([element1, element2]) pair2 = list(pair) elem1 = pair2[0] elem2 = […]

¿Los conjuntos de Python son mutables?

¿Los conjuntos en Python son mutables? En otras palabras, si hago esto: x = set([1, 2, 3]) y = x y |= set([4, 5, 6]) ¿ x y y siguen apuntando al mismo objeto, o se creó un nuevo conjunto y se asignó a y ?

Python: extracción rápida de intersecciones entre todas las posibles 2 combinaciones en un gran número de listas

Tengo un conjunto de datos de ca. Listas de 9K de longitud variable (1 a 100K elementos). Necesito calcular la longitud de la intersección de todas las combinaciones posibles de 2 listas en este conjunto de datos. Tenga en cuenta que los elementos de cada lista son únicos, por lo que se pueden almacenar como […]

¿Opuesto a set.intersection en python?

En Python puede usar a.intersection(b) para encontrar los elementos comunes a ambos conjuntos. ¿Hay una manera de hacer la versión opuesta desunida de esto? Artículos que no son comunes tanto a como a b ; los elementos únicos en a sindicado con los elementos únicos en b ?