Articles of set

¿Por qué recibo un error de “lista” de tipo no transitable al convertir una lista en un conjunto y volver?

Como muchas otras preguntas aquí, estoy tratando de eliminar duplicados de una lista. Sin embargo, cuando ejecuto el código que indica que otras respuestas funcionan correctamente, aparece el siguiente error: TypeError: unhashable type: ‘list’ En la siguiente línea de código: total_unique_words = list(set(total_words)) ¿Alguien sabe una posible solución a este problema? ¿Es esto porque en […]

Obteniendo tuplas únicas de un conjunto de python

Actualmente tengo un set como el siguiente: {(a,b), (b,a), (c,b), (b,c)} Lo que me gustaría tener es: {(a,b), (c,b)} Como puede observar, los valores duplicados se han eliminado completamente para que dos tuplas nunca tengan los mismos elementos en el interior, independientemente del orden. ¿Cómo puedo decirle al conjunto que ignore el orden de los […]

Cómo encontrar la diferencia establecida entre dos marcos de datos de Pandas

Me gustaría comprobar la diferencia entre dos columnas DataFrame. Intenté usar el comando: np.setdiff1d(train.columns, train_1.columns) lo que resulta en una matriz vacía: array([], dtype=object) Sin embargo, el número de columnas en los marcos de datos es diferente: len(train.columns), len(train_1.columns) = (51, 56) lo que significa que los dos DataFrame son obviamente diferentes. ¿Que esta mal […]

Python: comparación de frozensets

Considere el siguiente script: # multipleSmallFrozensets is a list of 7 frozensets of differenet number of string objects multipleSmallFrozensets = [ frozenset({‘YHR007C’, ‘YHR042W’}), frozenset({‘YPL274W’}), frozenset({‘YCL064C’}), frozenset({‘YBR166C’}), frozenset({‘YEL041W’, ‘YJR049C’}), frozenset({‘YGL142C’}), frozenset({‘YJL134W’, ‘YKR053C’})] # singleFrozenset is a frozenset of 3410 string objects singleFrozenset = frozenset({‘YIL140W’,’YLR268W’,’YLR357W’,’YJL155C’,’YHR067W’, ‘YAL008W’,’YBR255W’,’YFR027W’,’YGR148C’,’YJR122W’,’YJL204C’,’YJL093C’,’YLR244C’, ‘YNL003C’,’YBR111W-A’, …}) # don’t forget that i is of type frozenset […]

Eliminar elementos de un conjunto mientras se itera sobre él.

Tengo un conjunto de myset , y tengo una función que se itera sobre él para realizar alguna operación en sus elementos y esta operación finalmente elimina el elemento del conjunto. Obviamente, no puedo hacerlo mientras todavía estoy iterando sobre el conjunto original. Yo puedo, sin embargo, hacer esto: mylist = list(myset) for item in […]

Devolver subconjunto de lista que coincide con la condición

Digamos que tengo una lista de int s: listOfNumbers = range(100) Y quiero devolver una lista de los elementos que cumplen una determinada condición, digamos: def meetsCondition(element): return bool(element != 0 and element % 7 == 0) ¿Cuál es una forma Pythonic de devolver una sub- list de elementos en una list para la cual […]

¿Por qué tuple (set () == tuple (set ()) 85% del tiempo con la aleatorización de hash habilitada?

Dada la respuesta de Zero Piraeus a otra pregunta , tenemos que x = tuple(set([1, “a”, “b”, “c”, “z”, “f”])) y = tuple(set([“a”, “b”, “c”, “z”, “f”, 1])) print(x == y) Imprime True aproximadamente el 85% del tiempo con la aleatorización de hash habilitada. ¿Por qué el 85%?

Python’s y Numpy’s nan y set

Me encontré con un comportamiento impredecible con Python‘s Numpy, set y NaN (no es un número): >>> set([np.float64(‘nan’), np.float64(‘nan’)]) set([nan, nan]) >>> set([np.float32(‘nan’), np.float32(‘nan’)]) set([nan, nan]) >>> set([np.float(‘nan’), np.float(‘nan’)]) set([nan, nan]) >>> set([np.nan, np.nan]) set([nan]) >>> set([float(‘nan’), float(‘nan’)]) set([nan, nan]) Aquí np.nan produce un único conjunto de elementos, mientras que los nans de Numpy producen […]

Encuentra la diferencia establecida entre dos matrices grandes (matrices) en Python

Tengo dos matrices grandes de 2-d y me gustaría encontrar su diferencia de conjuntos tomando sus filas como elementos. En Matlab, el código para esto sería setdiff(A,B,’rows’) . Los arreglos son lo suficientemente grandes como para que los métodos obvios de bucle que se me ocurran tomen demasiado tiempo.

La reducción de series de pandas con múltiples valores de nan a un conjunto da múltiples valores de nan

Estoy esperando a que se set([nan,0,1]) pero se set([nan, 0.0, nan, 1.0]) : >>> import numpy as np >>> import pandas as pd >>> l= [np.nan,0,1,np.nan] >>> set(pd.Series(l)) set([nan, 0.0, nan, 1.0]) >>> set(pd.Series(l).tolist()) set([nan, 0.0, nan, 1.0]) >>> set(l) set([nan, 0, 1])