Articles of texto de

Contar la frecuencia de las letras en un archivo de texto

En Python, ¿cómo puedo iterar a través de un archivo de texto y contar el número de ocurrencias de cada letra? Me doy cuenta de que simplemente podría usar una statement ‘for x in file’ para revisarla y luego configurar 26 o más si hay declaraciones elif, ¿pero seguramente hay una mejor manera de hacerlo? […]

Análisis de las direcciones “De” del texto del correo electrónico

Estoy tratando de extraer las direcciones de correo electrónico de las transcripciones de texto sin formato de los correos electrónicos. He reunido un poco de código para encontrar las direcciones, pero no sé cómo discriminarlas; en este momento solo escupe todas las direcciones de correo electrónico en el archivo. Me gustaría que fuera solo para […]

imprimir el primer párrafo en python

Tengo un libro en un archivo de texto y necesito imprimir el primer párrafo de cada sección. Pensé que si encontraba un texto entre \ n \ ny \ n puedo encontrar mi respuesta. Aquí están mis códigos y no funcionó. ¿Puedes decirme que me equivoco? lines = [line.rstrip(‘\n’) for line in open(‘G:\\aa.txt’)] check = […]

Cómo agarrar las líneas DESPUÉS de una línea coincidente en python

Soy un aficionado que usa Python de vez en cuando. Lo siento si esta es una pregunta tonta, pero me preguntaba si alguien sabía una manera fácil de tomar un montón de líneas si el formato en el archivo de entrada es el siguiente: “Título 1 Línea 1 Línea 2 Línea 3 Título 2 Línea […]

Python / Matplotlib – Actualizando rápidamente el texto en los ejes

Tengo una figura / canvas de matplotlib en una ventana de wxpython. Quiero actualizar algo de información sobre la ttwig mientras el ratón se mueve. Me conecté a ‘motion_notify_event’ para obtener esta información. En el código a continuación, se trazan muchos datos aleatorios y luego la ubicación x, y del cursor se muestra en la […]

¿La forma más eficiente de indexar palabras en un documento?

Esto surgió en otra pregunta, pero pensé que es mejor hacer esto como una pregunta separada. Dé una lista grande de oraciones (orden de 100 mil): [ “This is sentence 1 as an example”, “This is sentence 1 as another example”, “This is sentence 2”, “This is sentence 3 as another example “, “This is […]

¿Cómo fusionar mediante progtwigción los archivos de texto con posibles conflictos (ala git o svn, etc.)?

Como parte de un proyecto más grande, quiero la capacidad de tomar dos cuerpos de texto y entregarlos a un algoritmo de combinación que devuelva un resultado fusionado automáticamente (en los casos en que los cambios no sean conflictivos) o arroje un error y (potencialmente) produce un solo documento de texto con los cambios en […]

Contar palabras distintas de un dataframe de Pandas

Tengo un dataframe de Pandas, donde una columna contiene texto. Me gustaría obtener una lista de palabras únicas que aparecen en toda la columna (el espacio es la única división). import pandas as pd r1=[‘My nickname is ft.jgt’,’Someone is going to my place’] df=pd.DataFrame(r1,columns=[‘text’]) La salida debería verse así: [‘my’,’nickname’,’is’,’ft.jgt’,’someone’,’going’,’to’,’place’] No estaría de más obtener […]

k-significa usando la matriz de firmas generada desde minhash

He usado minhash en documentos y sus tejas para generar una matriz de firma a partir de estos documentos. He verificado que las matrices de firmas son buenas, ya que comparan las distancias jaccard de documentos similares conocidos (por ejemplo, dos artículos sobre el mismo equipo deportivo o dos artículos sobre el mismo evento mundial) […]

El carácter aparece como un signo de interrogación de diamante solo al final de la línea (Python> Texto)

Estoy trabajando en un archivo Python que ingresa un archivo de texto con caracteres japoneses (UTF-8), toma parte del texto y lo escribe en un nuevo archivo de texto UTF-8. El problema que estoy encontrando es que, por alguna razón, cuando el carácter japonés aparece al final de una línea en el archivo de entrada […]