Articles of diff

JSON que difiere textualmente

Como parte de mis procesos de lanzamiento, tengo que comparar algunos datos de configuración JSON utilizados por mi aplicación. Como primer bash, simplemente imprimí el JSON y lo difuminé (usando kdiff3 o solo diff). Sin embargo, a medida que los datos crecieron, kdiff3 confunde diferentes partes en la salida, lo que hace que las adiciones […]

Compara dos archivos para las diferencias en python

Quiero comparar dos archivos (tomar la línea del primer archivo y buscar en el segundo archivo completo) para ver las diferencias entre ellos y escribir la línea que falta desde el archivo A.txt hasta el final del archivo B.txt. Soy nuevo en Python, así que al principio pensé en un progtwig simple como este: import […]

Difunde dos archivos grandes en Python

Tengo dos archivos de texto grandes, cerca de 2GB cada uno. Necesito algo como diff f1.txt f2.txt . ¿Hay alguna manera de hacer esta tarea rápido en python? El difflib estándar es demasiado lento. Supongo que hay una manera más rápida, porque difflib está completamente implementado en Python.

Python – diferencia entre dos cuerdas

Me gustaría almacenar muchas palabras en una lista. Muchas de estas palabras son muy similares. Por ejemplo, tengo la palabra afrykanerskojęzyczny y muchas palabras como afrykanerskojęzycznym , afrykanerskojęzyczni , nieafrykanerskojęzyczni . ¿Cuál es la solución efectiva (rápida y de tamaño pequeño) para encontrar la diferencia entre dos cadenas y restaurar la segunda cadena desde la […]

Generar html bastante diff en Python

Tengo dos partes de texto que me gustaría comparar y ver qué palabras / líneas se agregaron / eliminaron / modificaron en Python (similar a la salida Diff de un Wiki). He intentado difflib.HtmlDiff pero su salida es menos que bonita. ¿Hay alguna forma en Python (o biblioteca externa) que genere un HTML de aspecto […]

Algoritmo de diferencia de texto

Necesito un algoritmo que pueda comparar dos archivos de texto y resaltar su diferencia y (¡aún mejor!) Puede calcular su diferencia de manera significativa (como dos archivos similares deben tener una puntuación de similitud mayor que dos archivos diferentes, con la palabra “similar” definido en los términos normales). Suena fácil de implementar, pero no lo […]

Comparando imagen en url a imagen en sistema de archivos en python

¿Hay una manera rápida y fácil de hacer tal comparación? He encontrado pocas preguntas de comparación de imágenes de stackoverflow, pero ninguna de las respuestas probadas para esta pregunta. Tengo archivos de imágenes en mi sistema de archivos y un script que recupera imágenes de urls. Quiero verificar si la imagen en url ya es […]