Articles of duplicados

Determinación de valores duplicados en una matriz

Supongamos que tengo una matriz a = np.array([1, 2, 1, 3, 3, 3, 0]) ¿Cómo puedo (eficientemente, Pythonically) encontrar qué elementos de a son duplicados (es decir, valores no únicos)? En este caso, el resultado sería array([1, 3, 3]) o posiblemente array([1, 3]) si es eficiente. He ideado algunos métodos que parecen funcionar: Enmascaramiento m […]

Eliminar caracteres duplicados consecutivos de una cadena en Python

Hey, estaba intentando escribir un progtwig que eliminaría los caracteres duplicados consecutivos de una cadena. por ejemplo: cadena-> aabbccde primera iteración: bbccde segunda iteración: ccde tercera iteración: de y de es la respuesta. El siguiente es el progtwig que escribí. a = “aabbcs” def remove_dups(st,ind): print st, ind st = st.replace(st[ind], “”) print st, “in […]

Python (pandas): eliminar duplicados basados ​​en dos columnas manteniendo la fila con el valor máximo en otra columna

Tengo un dataframe que contiene valores duplicados de acuerdo con dos columnas (A y B): ABC 1 2 1 1 2 4 2 7 1 3 4 0 3 4 8 Quiero eliminar duplicados manteniendo la fila con el valor máximo en la columna C. Esto llevaría a: ABC 1 2 4 2 7 1 […]

Python: Eliminar par de cadenas duplicadas en orden aleatorio

Tengo una lista como abajo [(‘generators’, ‘generator’), (‘game’, ‘games’), (‘generator’, ‘generators’), (‘games’, ‘game’), (‘challenge’, ‘challenges’), (‘challenges’, ‘challenge’)] Los pares (‘game’, ‘games’) y (‘games’, ‘game’) son similares pero están en un orden diferente. La salida que estoy tratando de lograr [(‘generators’, ‘generator’), (‘games’, ‘game’), (‘challenge’, ‘challenges’)] ¿Cómo puedo eliminar pares como tales de la lista anterior? […]

Eliminar duplicados del diccionario

Tengo la siguiente estructura de datos del diccionario de Python 2.7 (no controlo los datos de origen; viene de otro sistema tal como está): {112762853378: {‘dst’: [’10 .121.4.136 ‘], ‘src’: [‘1.2.3.4’], ‘alias’: [‘www.example.com’] } 112762853385 {‘dst’: [’10 .121.4.136 ‘], ‘src’: [‘1.2.3.4’], ‘alias’: [‘www.example.com’] } 112760496444: {‘dst’: [’10 .121.4.136 ‘], ‘src’: [‘1.2.3.4’] } 112760496502 {‘dst’: [’10 […]

¿La mejor manera de eliminar caracteres duplicados (palabras) en una cadena?

¿Cuál sería la mejor manera de eliminar cualquier carácter duplicado y conjuntos de caracteres separados por espacios en cadena? Creo que este ejemplo lo explica mejor: foo = ‘hkk h2 h’ debe convertirse: foo = ‘hk h2’ # order not important Otro ejemplo: foo = ‘ssk’ se convierte en: foo = ‘sk’

Agrupe los ID de columna duplicados en el dataframe de pandas

Ahora hay muchas preguntas similares, pero la mayoría responde cómo eliminar las columnas duplicadas. Sin embargo, quiero saber cómo puedo hacer una lista de tuplas donde cada tupla contiene los nombres de columna de columnas duplicadas. Supongo que cada columna tiene un nombre único. Solo para ilustrar mi pregunta: df = pd.DataFrame({‘A’: [1, 2, 3, […]

Duplicar instancias de modelos y sus objetos relacionados en Django / Algoritmo para duplicar recusivamente un objeto

Tengo modelos para Books , Chapters y Pages . Todos están escritos por un User : from django.db import models class Book(models.Model) author = models.ForeignKey(‘auth.User’) class Chapter(models.Model) author = models.ForeignKey(‘auth.User’) book = models.ForeignKey(Book) class Page(models.Model) author = models.ForeignKey(‘auth.User’) book = models.ForeignKey(Book) chapter = models.ForeignKey(Chapter) Lo que me gustaría hacer es duplicar un Book existente y […]

¿Cuál es la forma más pythonica de identificar duplicados consecutivos en una lista?

Tengo una lista de enteros y quiero poder identificar bloques de duplicados contiguos: es decir, quiero producir una lista de duplicados que conserva el orden donde cada duple contiene (int_in_question, número de ocurrencias). Por ejemplo, si tengo una lista como: [0, 0, 0, 3, 3, 2, 5, 2, 6, 6] Quiero que el resultado sea: […]

¿Cómo verifico si hay duplicados en una lista plana?

Por ejemplo, dada la lista [‘one’, ‘two’, ‘one’] , el algoritmo debe devolver True , mientras que dado [‘one’, ‘two’, ‘three’] debe devolver False .