Articles of estructuras de datos

¿Estructura de datos para realizar búsquedas rápidas de GPS?

Tengo un archivo de texto (UTF-8, ~ 50K líneas) con nombres de ciudades y coordenadas GPS. Líneas de ejemplo: San Pedro locality -3367 -5968 Argentina Buenos Aires San Pedro Talagante locality -3366 -7093 Chile Metropolitana Talagante Peñaflor locality -3362 -7092 Chile Metropolitana Talagante La tercera y cuarta columnas son las coordenadas GPS de las ciudades […]

¿Cómo analizar código (en Python)?

Necesito analizar algunas estructuras de datos especiales. Están en un formato algo parecido a C que se parece aproximadamente a esto: Group(“GroupName”) { /* C-Style comment */ Group(“AnotherGroupName”) { Entry(“some”,”variables”,0,3.141); Entry(“other”,”variables”,1,2.718); } Entry(“linebreaks”, “allowed”, 3, 1.414 ); } Puedo pensar en varias maneras de hacer esto. Podría ‘tokenizar’ el código usando expresiones regulares. Podría leer […]

Planificación de la estructura del progtwig Python OO

Soy un principiante en OOP y quiero crear un progtwig con tres clases, A, B y C. Cada instancia de la clase está definida por un conjunto de características, Achar1, Achar2, etc. Se supone que el progtwig crea usos que comprenden el elemento A, el elemento B y el elemento C con fecha de inicio […]

Grupo de entidades de GAE / modelado de datos para la consistencia y el rendimiento

Como continuación de esta publicación , esta es una pregunta de estilo capstone para solidificar mi comprensión de gae-datastore y obtener algunas críticas sobre mis decisiones de modelado de datos. Estaré modificando el ejemplo de Jukebox creado por @Jimmy Kane para reflejar mejor mi caso del mundo real. En la configuración original, Imagina que tienes […]

Árbol de busqueda transversal transversales.

Estoy confundido con la recursión en los transversales del árbol binario de búsqueda, estoy perdido porque necesito devolver una lista al final y no entiendo cómo guardar los valores. Agrega valores como este que se muestran a continuación y no obtener el tipo de datos que se usa para guardar los valores así, tampoco creo […]

Cuándo usar multiindexing vs. xarray en pandas

La documentación de las tablas dinámicas de pandas parece recomendar tratar con más de dos dimensiones de datos utilizando el multiindexing: In [1]: import pandas as pd In [2]: import numpy as np In [3]: import pandas.util.testing as tm; tm.N = 3 In [4]: def unpivot(frame): …: N, K = frame.shape …: data = {‘value’ […]

Uso de memoria en la manipulación / procesamiento de grandes estructuras de datos.

Tengo varios archivos grandes (~ 100 Mb) que estoy procesando regularmente. Mientras trato de eliminar estructuras de datos innecesarias durante el procesamiento, el consumo de memoria es un poco demasiado alto. Me preguntaba si hay una manera de manipular eficientemente datos grandes, por ejemplo: def read(self, filename): fc = read_100_mb_file(filename) self.process(fc) def process(self, content): # […]

Convertir la salida del análisis de dependencia al árbol

Estoy usando el Stanford dependency parser y obtengo el siguiente resultado de la oración Le disparé a un elefante en mi sueño python dep_parsing.py [((u’shot’, u’VBD’), u’nsubj’, (u’I’, u’PRP’)), ((u’shot’, u’VBD’), u’dobj’, (u’elephant’, u’NN’)), ((u’elephant’, u’NN’), u’det’, (u’an’, u’DT’)), ((u’shot’, u’VBD’), u’nmod’, (u’sleep’, u’NN’)), ((u’sleep’, u’NN’), u’case’, (u’in’, u’IN’)), ((u’sleep’, u’NN’), u’nmod:poss’, (u’my’, u’PRP$’))] Quiero […]

¿Para qué utilizarías el módulo Python heapq en la vida real?

Después de leer la clasificación de Guido de un millón de enteros de 32 bits en 2 MB de RAM usando Python , descubrí el módulo heapq , pero el concepto es bastante abstracto para mí. Una razón es que no entiendo completamente el concepto de un montón, pero entiendo cómo lo usó Guido. Ahora, […]

Python cómo crear un dict de dict de lista con defaultdict

¿Cómo creo un dict de dictado de listas usando defaultdict? Estoy teniendo el siguiente error. >>> from collections import defaultdict >>> a=defaultdict() >>> a[“testkey”]=None >>> a defaultdict(None, {‘testkey’: None}) >>> a[“testkey”][“list”]=[] Traceback (most recent call last): File “”, line 1, in TypeError: ‘NoneType’ object does not support item assignment