Articles of estructuras de datos de

Estructura de datos de Python para agregar, eliminar y random.choice eficientes

Estoy buscando una estructura de datos Python add que pueda add un nuevo elemento, remove un elemento existente y elegir un elemento aleatorio, todo en un tiempo mejor que O (n). Esperaba que el set pudiera hacer esto, pero AFAIK, la única forma de elegir un elemento aleatorio de un conjunto de Python es random.choice(list(my_set)) […]

Estructura de datos ideal con búsqueda rápida, actualización rápida y fácil comparación / clasificación

Estoy buscando una buena estructura de datos para contener una lista de tuplas con valores (hash, timestamp) . Básicamente, quiero usarlo de la siguiente manera: Los datos entran, compruebe si ya está presente en la estructura de datos (igualdad de hash, no marca de tiempo). Si es así, actualice la marca de tiempo a “ahora” […]

Python: ¿calcula funciones de densidad de probabilidad multinomiales en un gran conjunto de datos?

Originalmente pretendía usar MATLAB para abordar este problema, pero la función incorporada tiene limitaciones que no se adaptan a mi objective. La misma limitación ocurre en NumPy. Tengo dos archivos delimitados por tabuladores. El primero es un archivo que muestra los residuos de aminoácidos, la frecuencia y el recuento de una base de datos interna […]

Python: Encontrar una clave (cadena) en un diccionario que contiene una subcadena

En mi script, construyo un diccionario de claves (álbumes) asignadas a artistas (valores) para poder hacer una búsqueda rápida de lo que los artistas hicieron en qué álbumes. Sin embargo, quiero que el usuario pueda encontrar todos los álbumes que contienen una subcadena. Por ejemplo, una búsqueda en “Light” debería regresar [Light Chasers] = Cloud […]

El equivalente de TreeSet de Java en Python?

Recientemente encontré un código Java que simplemente puso algunas cadenas en un Java TreeSet, implementé un comparador basado en la distancia para él, y luego hice su camino alegre hacia la puesta del sol para calcular una puntuación determinada para resolver el problema dado. Mis preguntas, ¿Hay una estructura de datos equivalente disponible para Python? […]

¿Existe una estructura de datos similar a un diccionario que permita búsquedas de ‘clave’ y de ‘valor’?

Necesito una estructura para mi pequeño progtwig Python para guardar una lista de máximo 500 nombres con un número cada uno. Los nombres serían únicos, pero los números se repetirían (a menudo). Primero pensé en un diccionario , pero también necesito poder buscar los números, por ejemplo, tendría que cambiar los 2 a 3 . […]

En el apio, ¿cómo ejecuto una tarea y luego hago que esa tarea ejecute otra tarea y la mantenga en marcha?

#tasks.py from celery.task import Task class Randomer(Task): def run(self, **kwargs): #run Randomer again!!! return random.randrange(0,1000000) >>> from tasks import Randomer >>> r = Randomer() >>> r.delay() En este momento, ejecuto la tarea simple. Y devuelve un número aleatorio. Pero, ¿cómo hago para que ejecute otra tarea, dentro de esa tarea ?

Python equivalente a java.util.SortedSet?

¿Alguien sabe si Python tiene un equivalente a la interfaz SortedSet de Java? Aquí está lo que estoy buscando: digamos que tengo un objeto de tipo foo , y sé cómo comparar dos objetos de tipo foo para ver si foo1 es “mayor que” o “menor que” foo2 . Quiero una forma de almacenar muchos […]

Filtrado / iteración a través de listas muy grandes en python

Si tengo una lista con, por ejemplo, 10 millones de objetos, ¿cómo puedo filtrar la lista rápidamente? Se tarda unos 4-5 segundos para una iteración completa a través de una lista de comprensión. ¿Hay estructuras de datos o bibliotecas eficientes para esto en Python? ¿O Python no es adecuado para grandes conjuntos de datos?

¿Qué estructura de progtwigción para el algoritmo de clustering?

Estoy tratando de implementar el siguiente algoritmo de agrupamiento (divisivo) (a continuación se presenta una forma corta del algoritmo, la descripción completa está disponible aquí ): Comience con una muestra x, i = 1, …, n considerada como un grupo único de n puntos de datos y una matriz de disimilitud D definida para todos […]