Articles of conjunto de

Intersección de dos listas de cuerdas

Tuve una pregunta de entrevista en este sentido: Dadas dos listas de clientes desordenados, devuelva una lista de la intersección de las dos listas. Es decir, devolver una lista de los clientes que aparecen en ambas listas. Algunas cosas que establecí: Supongamos que cada cliente tiene un nombre único Si el nombre es el mismo […]

Cadena de conjuntos de datos de múltiples archivos HDF5 / conjuntos de datos

Los beneficios y la asignación simplista que proporciona h5py (a través de HDF5) para la persistencia de conjuntos de datos en el disco es excepcional. Realizo algunos análisis en un conjunto de archivos y almaceno el resultado en un conjunto de datos, uno para cada archivo. Al final de este paso, tengo un conjunto de […]

¿Hay alguna diferencia entre ‘y’ y ‘&’ con respecto a los conjuntos de python?

Obtuve una muy buena ayuda para la pregunta de verificación si la clave del diccionario tiene un valor vacío . Pero me preguntaba si hay una diferencia entre and y en python? Supongo que deberían ser similares? dict1 ={“city”:””,”name”:”yass”,”region”:””,”zipcode”:””, “phone”:””,”address”:””,”tehsil”:””, “planet”:”mars”} whitelist = {“name”, “phone”, “zipcode”, “region”, “city”, “munic”, “address”, “subarea”} result = {k: dict1[k] […]

Haz un diagtwig de dispersión a partir del conjunto de puntos en las tuplas.

Tengo un conjunto de puntos en tuplas, como este: >>> s set([(209, 147), (220, 177), (222, 181), (225, 185), (288, 173), (211, 155), (222, 182)]) ¿Cuál es la forma correcta de hacer un diagtwig de dispersión de este conjunto?

Conjuntos ordenados Python 2.7

Tengo una lista de la que estoy intentando eliminar elementos duplicados. Estoy usando python 2.7.1, así que simplemente puedo usar la función set () . Sin embargo, esto reordena mi lista. Lo cual para mi caso particular es inaceptable. A continuación hay una función que escribí; que hace esto. Sin embargo, me pregunto si hay […]

¿Diccionario de Python que asigna cadenas a un conjunto de cadenas?

Me gustaría poder hacer un diccionario de Python con cadenas como claves y conjuntos de cadenas como valores. Por ejemplo: { “crackers” : [“crunchy”, “salty”] } Debe ser un conjunto, no una lista. Sin embargo, cuando bash lo siguiente: word_dict = dict() word_dict[“foo”] = set() word_dict[“foo”] = word_dict[“foo”].add(“baz”) word_dict[“foo”] = word_dict[“foo”].add(“bang”) Yo obtengo: Traceback (most […]

Cómo verificar si un valor está presente en cualquiera de los conjuntos dados

Digamos que tengo diferentes conjuntos (tienen que ser diferentes, no puedo unirlos según el tipo de datos con los que estoy trabajando): r = set([1,2,3]) s = set([4,5,6]) t = set([7,8,9]) ¿Cuál es la mejor manera de verificar si una variable dada está presente en alguna de ellas? Estoy usando: if myvar in r \ […]

¿Cómo puedo encontrar la intersección de dos archivos grandes de manera eficiente utilizando Python?

Tengo dos archivos grandes. Su contenido se ve así: 134430513 125296589 151963957 125296589 El archivo contiene una lista de ids sin clasificar. Algunos identificadores pueden aparecer más de una vez en un solo archivo. Ahora quiero encontrar la parte de la intersección de dos archivos. Es decir, los identificadores aparecen en ambos archivos. Acabo de […]

Python: Elementos únicos de lista en el orden en que aparecen.

En Python, podemos obtener los elementos únicos de la lista usando set(list) . Sin embargo, al hacer esto se rompe el orden en que aparecen los valores en la lista original. ¿Existe una manera elegante de obtener los elementos únicos en el orden en que aparecen en la lista?

Aplicar una función de pares en una serie de pandas.

Tengo una serie de pandas cuyos elementos constituyen frozensets: data = {0: frozenset({‘apple’, ‘banana’}), 1: frozenset({‘apple’, ‘orange’}), 2: frozenset({‘banana’}), 3: frozenset({‘kumquat’, ‘orange’}), 4: frozenset({‘orange’}), 5: frozenset({‘orange’, ‘pear’}), 6: frozenset({‘orange’, ‘pear’}), 7: frozenset({‘apple’, ‘banana’, ‘pear’}), 8: frozenset({‘banana’, ‘persimmon’}), 9: frozenset({‘apple’}), 10: frozenset({‘banana’}), 11: frozenset({‘apple’})} tokens = pd.Series(data); tokens 0 (apple, banana) 1 (orange, apple) 2 (banana) […]