Articles of diff

Difundir archivos binarios en Python

Tengo dos archivos binarios. Se ven algo así, pero los datos son más aleatorios: Presentar un: FF FF FF FF 00 00 00 00 FF FF 44 43 42 41 FF FF … Archivo B: 41 42 43 44 00 00 00 00 44 43 42 41 40 39 38 37 … Lo que me […]

Git-diff a HTML

Estoy buscando una manera de producir archivos HTML a partir de una salida de git–diff, preferiblemente usando python. He estado buscando en http://docs.python.org/library/difflib.html sin poder averiguar cómo usar la salida de git-diff como entrada. ¿Cualquier pista? Muchas gracias

¿Existe una API de Python para dibujar diagtwigs (que usa líneas para conectar los valores correspondientes entre dos listas)

Dadas dos listas, que contienen los mismos elementos de cadena pero en diferentes órdenes, hay alguna API que pueda dibujar diagtwigs como El diagtwig consta de dos stacks de cuerda. Entre estas dos stacks, las líneas se utilizan para vincular los mismos elementos entre estas dos stacks. Su perspectiva es similar a la visualización de […]

¿Es posible que todos los comandos de “git diff” usen el “Python diff” en todos los proyectos de git?

Cuando se incluye la linea *.py diff=python en un archivo .gitattributes local, git diff produce tags agradables para los diferentes tipos de archivos de Python (con el nombre de la función donde están los cambios, etc.). ¿Es posible pedirle a git que use este modo de diferencias para todos los archivos de Python en todos […]

Construyendo un HTML Diff / Patch Algorithm

Una descripción de lo que voy a lograr: Entrada 2 (N no es esencial) documentos HTML. Estandarizar el formato HTML. Difunda los dos documentos: los estilos externos no son importantes, pero se incluirá cualquier elemento en línea con el documento. Determine delta en el nivel Elemento de bloque HTML. Ampliando el último punto: Imagine dos […]

Implementación de algoritmos de diferenciación en python.

Hola a todos: Revisé el código fuente de Python 2.6, y quiero estudiar la implementación de diff en python. Sin embargo, no puedo encontrar el archivo fuente correcto. ¿Podría alguien darme alguna información sobre qué archivo de origen contenía la implementación del algoritmo en Python? Gracias por cualquier información!

Implementando la API DiffMatchPatch de Google para Python 2/3

Quiero escribir una aplicación de diferencia simple en Python utilizando las API de Diff Match Patch de Google . Soy bastante nuevo en Python, por lo que quiero un ejemplo de cómo utilizar la API de parches Diff Match para comparar semánticamente dos párrafos de texto. No estoy muy seguro de cómo utilizar el archivo […]

Encuentra rápidamente las diferencias entre dos archivos de texto grandes

Tengo dos archivos de texto de 3GB, cada archivo tiene alrededor de 80 millones de líneas. Y comparten 99,9% de líneas idénticas (el archivo A tiene 60,000 líneas únicas, el archivo B tiene 80,000 líneas únicas). ¿Cómo puedo encontrar rápidamente esas líneas únicas en dos archivos? ¿Hay alguna herramienta de línea de comandos lista para […]

actualización de dict de Python

¿Python tiene algún tipo de funcionalidad incorporada para notificar qué elementos del diccionario cambiaron en la actualización del dict? Por ejemplo, estoy buscando alguna funcionalidad como esta: >>> a = {‘a’:’hamburger’, ‘b’:’fries’, ‘c’:’coke’} >>> b = {‘b’:’fries’, ‘c’:’pepsi’, ‘d’:’ice cream’} >>> a.diff(b) {‘c’:’pepsi’, ‘d’:’ice cream’} >>> a.update(b) >>> a {‘a’:’hamburger’, ‘b’:’fries’, ‘c’:’pepsi’, ‘d’:’ice cream’} Estoy […]

Algoritmo para detectar documentos similares en script python

Necesito escribir un módulo para detectar documentos similares. He leído muchos documentos de huellas dactilares de técnicas de documentos y otros, pero no sé cómo escribir código o implementar dicha solución. El algoritmo debería funcionar para el idioma chino, japonés, inglés y alemán o ser independiente del idioma. ¿Cómo puedo lograr esto?