Articles of text

Python: EOFError: EOF al leer una línea

Esto puede repetirse, pero ninguna de las respuestas existentes resolvió mi problema. Entonces, estoy usando Python 2.7 , y recibo este error (título) cada vez que bash esto: number = int(raw_input(‘Number : ‘)) Intenté esto en Sublime Text 2, compileronline.com y en codecademy; falla en los 2 primeros de estos sitios. Funciona en codecademy y […]

Enumere las palabras en un vocabulario de acuerdo con la ocurrencia en un corpus de texto, Scikit-Learn

He instalado un CountVectorizer para algunos documentos en scikit-learn . Me gustaría ver todos los términos y su frecuencia correspondiente en el corpus de texto, para seleccionar palabras clave. Por ejemplo ‘and’ 123 times, ‘to’ 100 times, ‘for’ 90 times, … and so on ¿Hay alguna función incorporada para esto?

JSON que difiere textualmente

Como parte de mis procesos de lanzamiento, tengo que comparar algunos datos de configuración JSON utilizados por mi aplicación. Como primer bash, simplemente imprimí el JSON y lo difuminé (usando kdiff3 o solo diff). Sin embargo, a medida que los datos crecieron, kdiff3 confunde diferentes partes en la salida, lo que hace que las adiciones […]

Parsing reStructuredText en HTML

Estoy creando un marco en el que permito a los desarrolladores describir su paquete utilizando reStructuredText. Quiero analizar ese texto reStructured en HTML para poder mostrarlo en una GUI. Estoy familiarizado con la excelente Esfinge, pero nunca he analizado el texto edStructured. Imaginé algo así como una función que toma una cadena de reStructuredText, y […]

¿Buscando texto en un PDF usando Python?

Problema Estoy tratando de determinar qué tipo de documento es (p. Ej., Alegatos, correspondencia, citación, etc.) buscando en su texto, preferiblemente usando python. Se pueden buscar en todos los archivos PDF, pero no he encontrado una solución para analizarlos con Python y aplicar un script para buscarlos (aparte de convertirlos primero en un archivo de […]

python PIL dibujar texto multilínea en la imagen

Intento agregar texto en la parte inferior de la imagen y en realidad lo he hecho, pero en el caso de que mi texto sea más largo que el ancho de la imagen, se corta desde ambos lados, para simplificar, me gustaría que el texto esté en varias líneas, si es más largo que el […]

PDFminer: PDFTextExtractionNotAllowed Error

Estoy intentando extraer texto de archivos PDF que he eliminado de Internet, pero cuando bash descargarlos, aparece el error: File “/usr/local/lib/python2.7/dist-packages/pdfminer/pdfpage.py”, line 124, in get_pages raise PDFTextExtractionNotAllowed(‘Text extraction is not allowed: %r’ % fp) PDFTextExtractionNotAllowed: Text extraction is not allowed He comprobado que stackoverflow y otra persona que tuvo este error encontraron que sus archivos […]

Convierta el archivo NetCDF a CSV o texto usando Python

Estoy intentando convertir un archivo netCDF a un archivo CSV o de texto usando Python. He leído este post pero todavía me falta un paso (soy nuevo en Python). Es un conjunto de datos que incluye datos de latitud, longitud, tiempo y precipitación. Este es mi código hasta ahora: import netCDF4 import pandas as pd […]

Sólo se extrae texto de este elemento, no sus hijos.

Quiero extraer solo el texto del elemento más alto de mi sopa; Sin embargo, soup.text también proporciona el texto de todos los elementos secundarios: yo tengo import BeautifulSoup soup=BeautifulSoup.BeautifulSoup(‘yesno’) print soup.text La salida a esto es yesno . Quiero simplemente “sí”. ¿Cuál es la mejor manera de lograr esto? Edición : también quiero que se […]

¿Cómo crear un cuadro de entrada de texto con pygame?

Quiero obtener algo de entrada de texto del usuario en python y mostrar lo que están escribiendo en un cuadro de texto, y cuando presionan enter, se almacena en una cadena. He buscado en todas partes, pero no puedo encontrar nada (estoy usando pygame)