Articles of estructuras de datos

Grupo de entidades de GAE / modelado de datos para la consistencia y el rendimiento

Como continuación de esta publicación , esta es una pregunta de estilo capstone para solidificar mi comprensión de gae-datastore y obtener algunas críticas sobre mis decisiones de modelado de datos. Estaré modificando el ejemplo de Jukebox creado por @Jimmy Kane para reflejar mejor mi caso del mundo real. En la configuración original, Imagina que tienes […]

Árbol de busqueda transversal transversales.

Estoy confundido con la recursión en los transversales del árbol binario de búsqueda, estoy perdido porque necesito devolver una lista al final y no entiendo cómo guardar los valores. Agrega valores como este que se muestran a continuación y no obtener el tipo de datos que se usa para guardar los valores así, tampoco creo […]

Cuándo usar multiindexing vs. xarray en pandas

La documentación de las tablas dinámicas de pandas parece recomendar tratar con más de dos dimensiones de datos utilizando el multiindexing: In [1]: import pandas as pd In [2]: import numpy as np In [3]: import pandas.util.testing as tm; tm.N = 3 In [4]: def unpivot(frame): …: N, K = frame.shape …: data = {‘value’ […]

Uso de memoria en la manipulación / procesamiento de grandes estructuras de datos.

Tengo varios archivos grandes (~ 100 Mb) que estoy procesando regularmente. Mientras trato de eliminar estructuras de datos innecesarias durante el procesamiento, el consumo de memoria es un poco demasiado alto. Me preguntaba si hay una manera de manipular eficientemente datos grandes, por ejemplo: def read(self, filename): fc = read_100_mb_file(filename) self.process(fc) def process(self, content): # […]

Convertir la salida del análisis de dependencia al árbol

Estoy usando el Stanford dependency parser y obtengo el siguiente resultado de la oración Le disparé a un elefante en mi sueño python dep_parsing.py [((u’shot’, u’VBD’), u’nsubj’, (u’I’, u’PRP’)), ((u’shot’, u’VBD’), u’dobj’, (u’elephant’, u’NN’)), ((u’elephant’, u’NN’), u’det’, (u’an’, u’DT’)), ((u’shot’, u’VBD’), u’nmod’, (u’sleep’, u’NN’)), ((u’sleep’, u’NN’), u’case’, (u’in’, u’IN’)), ((u’sleep’, u’NN’), u’nmod:poss’, (u’my’, u’PRP$’))] Quiero […]

¿Para qué utilizarías el módulo Python heapq en la vida real?

Después de leer la clasificación de Guido de un millón de enteros de 32 bits en 2 MB de RAM usando Python , descubrí el módulo heapq , pero el concepto es bastante abstracto para mí. Una razón es que no entiendo completamente el concepto de un montón, pero entiendo cómo lo usó Guido. Ahora, […]

Python cómo crear un dict de dict de lista con defaultdict

¿Cómo creo un dict de dictado de listas usando defaultdict? Estoy teniendo el siguiente error. >>> from collections import defaultdict >>> a=defaultdict() >>> a[“testkey”]=None >>> a defaultdict(None, {‘testkey’: None}) >>> a[“testkey”][“list”]=[] Traceback (most recent call last): File “”, line 1, in TypeError: ‘NoneType’ object does not support item assignment

tamaño de memoria de la estructura de datos de Python

¿Cómo puedo averiguar el tamaño de la memoria de una estructura de datos de Python? Estoy buscando algo como: sizeof({1:’hello’, 2:’world’}) Es genial si cuenta todo recursivamente. Pero incluso un resultado básico no recursivo ayuda. Básicamente, quiero tener una idea de las diversas opciones de implementación, como tupla vs lista vs clase, en términos de […]

La forma más rápida de probar la lista enlazada es circular? en python

¿Podría alguien, por favor, hacerme saber cuál es la mejor manera de probar que una lista vinculada contiene un bucle? Estoy usando un algoritmo con dos punteros, uno se mueve lento con uno pasos y el otro se mueve más rápido con dos pasos. class Node(object): def __init__(self, value, next=None): self.next=next self.value=value def create_list(): last […]

Iteración pythonica sobre múltiples listas en paralelo

Me gustaría conocer una forma elegante y pythonica de iterar sobre una lista de listas (o dictado de listas) en paralelo en Python 3. El número de listas no se conoce hasta el tiempo de ejecución, por lo que creo que no puedo simplemente proporcionarlas como argumentos. a la función zip() . Por ejemplo, dada […]