Articles of estructuras de datos de

Python equivalente a java.util.SortedSet?

¿Alguien sabe si Python tiene un equivalente a la interfaz SortedSet de Java? Aquí está lo que estoy buscando: digamos que tengo un objeto de tipo foo , y sé cómo comparar dos objetos de tipo foo para ver si foo1 es “mayor que” o “menor que” foo2 . Quiero una forma de almacenar muchos […]

Filtrado / iteración a través de listas muy grandes en python

Si tengo una lista con, por ejemplo, 10 millones de objetos, ¿cómo puedo filtrar la lista rápidamente? Se tarda unos 4-5 segundos para una iteración completa a través de una lista de comprensión. ¿Hay estructuras de datos o bibliotecas eficientes para esto en Python? ¿O Python no es adecuado para grandes conjuntos de datos?

¿Qué estructura de progtwigción para el algoritmo de clustering?

Estoy tratando de implementar el siguiente algoritmo de agrupamiento (divisivo) (a continuación se presenta una forma corta del algoritmo, la descripción completa está disponible aquí ): Comience con una muestra x, i = 1, …, n considerada como un grupo único de n puntos de datos y una matriz de disimilitud D definida para todos […]

¿Cómo Python almacena las listas internamente?

¿Cómo se almacenan internamente las listas en python? ¿Es una matriz? ¿Una lista enlazada? ¿Algo más? ¿O el intérprete adivina la estructura correcta para cada instancia según la longitud, etc.? Si la pregunta depende de la implementación, ¿qué pasa con el CPython clásico?

¿Cuál es la diferencia entre () vs vs {}?

¿Cuál es la diferencia entre () vs [] vs {} en Python? ¿Son colecciones? ¿Cómo puedo saber cuándo usar cuál?

Diferencia entre tuplas y frozensets en Python

Estoy aprendiendo Python 3 utilizando The Quick Python Book, donde el autor habla sobre frozensets, y afirma que, dado que los conjuntos son mutables y, por lo tanto, inestables, se vuelven inadecuados para ser claves de diccionario, se introdujeron sus equivalentes congelados. Aparte de la diferencia obvia de que una tupla es una estructura de […]

¿La mejor manera de definir diccionarios multidimensionales en python?

Actualmente estoy usando el método a continuación para definir un diccionario multidimensional en python. Mi pregunta es: ¿Es esta la forma preferida de definir los dictados multidimensionales? from collections import defaultdict def site_struct(): return defaultdict(board_struct) def board_struct(): return defaultdict(user_struct) def user_struct(): return dict(pageviews=0,username=”,comments=0) userdict = defaultdict(site_struct) para obtener la siguiente estructura: userdict[‘site1’][‘board1’][‘username’] = ‘tommy’ También […]

Extraer valores de elementos en una lista de diccionarios.

Tengo una estructura de datos de python de la siguiente manera: A = [{‘abc’: ‘kjkjl’},{‘abc’: ‘hjhjh’},{‘abc’: ‘78787’}] ¿Cómo puedo eliminar el ‘abc’ de A y hacer una nueva lista: B = [‘kjkjl’,’hjhjh’,’78787′] EDIT: Todavía me sale el siguiente error al utilizar las soluciones: return codecs.charmap_encode(input,errors,encoding_table) UnicodeEncodeError: ‘charmap’ codec can’t encode character u’\u03b9′ in position 10: […]

Reorganizar los niveles de un diccionario nested en Python

¿Existe una biblioteca que me ayude a lograr la tarea de reorganizar los niveles de un diccionario nested? Ej .: De esto: {1:{“A”:”i”,”B”:”ii”,”C”:”i”},2:{“B”:”i”,”C”:”ii”},3:{“A”:”iii”}} A esto: {“A”:{1:”i”,3:”iii”},”B”:{1:”ii”,2:”i”},”C”:{1:”i”,2:”ii”}} Es decir, dos primeros niveles en un diccionario de 3 niveles intercambiados. Entonces, en lugar de 1 mapeo a A y 3 mapeo a A, tenemos A mapeo a […]

¿Diccionario compartido entre objetos sin motivo?

Se supone que el siguiente código crea una nueva versión (modificada) de una distribución de frecuencia (nltk.FreqDist). Ambas variables deben ser de la misma longitud. Funciona bien cuando se crea una sola instancia de WebText. Pero cuando se crean múltiples instancias de WebText, la nueva variable parece ser compartida por todos los objetos. Por ejemplo: […]