Articles of ocr

Tesseract utiliza subconjunto de letras

Estoy usando el paquete tesseract–ocr en Ubuntu Linux, lo he estado usando por un tiempo y creo que para mejorar la precisión del OCR solo necesito un subconjunto de letras del alfabeto. Las letras que necesito son: 0123456789abcdefghijklmnopqrstuvwxyz y solo eso, ni siquiera las mayúsculas, ¿alguien puede ayudarme a indicar tesseract para que coincida solo […]

¿Cómo eliminar caracteres inválidos entre múltiples cadenas en python?

Estoy trabajando en un proyecto con OCR en español . La cámara captura diferentes marcos en una línea de texto. La línea de texto contiene esto: Este texto es una prueba del dispositivo lector para no videntes. Después de algunas operaciones me dan cuerdas como esas: s1 = “Este texto, es una p!” s2 = […]

Usando la biblioteca pypdfocr desde un script de Python

¿Cómo se puede ejecutar pypdfocr desde una secuencia de comandos de Python, a diferencia de la línea de comandos? Esta pregunta ¿Cómo llamar a las funciones pypdfocr para usarlas en un script de python? Se acerca a la respuesta que quiero, pero no llega. import pypdfocr from pypdfocr import pypdfocr from pypdfocr.pypdfocr import PyPDFOCR as […]

Python Selenium Cambiar tamaño de texto (¿Zoom? ¿Configuración?…)

Tengo una página web que necesito para tomar la captura de pantalla primero y luego usar OCR para analizar los textos que contiene. El rendimiento de OCR podría mejorarse drásticamente si me acerco (Mac: comando + ‘=’). Así que me pregunto cómo podría acercarme / alejarme usando selenium en Python. Hay una publicación similar pero […]

“ValueError: no se pueden filtrar las imágenes de la paleta” durante la conversión de Pytesseract

Tiene problemas con este código de error en relación con el siguiente código para Pytesseract. (Python 3.6.1, Mac OSX) importar solicitudes de importación de pytesseract desde PIL importar Imagen desde PIL importar ImageFilter desde io import StringIO, BytesIO def process_image(url): image = _get_image(url) image.filter(ImageFilter.SHARPEN) return pytesseract.image_to_string(image) def _get_image(url): r = requests.get(url) s = BytesIO(r.content) img […]

Pase la imagen de OpenCV al buscador de KNearest

He estado siguiendo los ejemplos aquí sobre la configuración de Python para OCR al capacitar a OpenCV utilizando la clasificación kNN. Seguí el primer ejemplo y knn_data.npz un knn_data.npz que almacena los datos de entrenamiento y las tags de entrenamiento para más adelante. Lo que estoy tratando de hacer ahora es recordar los datos de […]

ocr’ing texto de la aplicación (no escaneado, NO captchas)

Me gustaría interconectar una aplicación leyendo el texto que se muestra. He tenido éxito en algunas aplicaciones cuando Windows no está haciendo ningún tipo de suavizado de fonts escribiendo una frase manualmente, representándola en todas las fonts de Windows y encontrando una coincidencia. Desde allí puedo asignar cada imagen de letra a una letra generando […]

image_to_string no funciona en Mac

Estoy tratando de seguir este ejemplo de pytesser ( enlace ) en un Mac Maverick. >>> from pytesser import * >>> im = Image.open(‘phototest.tif’) >>> text = image_to_string(im) Pero, en la última línea me sale este mensaje de error: Traceback (most recent call last): File “”, line 1, in File “pytesser.py”, line 31, in image_to_string […]

Detección de texto en imágenes.

Estoy usando el código de ejemplo que se encuentra debajo para la detección de texto en imágenes (no manuscritas) usando coreml y vision. https://github.com/DrNeuroSurg/OCRwithVisionAndCoreML-Part2 En esto, han utilizado un modelo de aprendizaje automático que solo admite mayúsculas y números. Donde, como en mi proyecto, quiero mayúsculas, minúsculas, números y pocos caracteres especiales (como:, -). No […]

OCR de texto de baja resolución de capturas de pantalla

Estoy escribiendo una aplicación OCR para leer caracteres de una imagen de captura de pantalla. Actualmente, me estoy centrando sólo en los dígitos. Estoy basando parcialmente mi enfoque en esta publicación de blog: http://blog.damiles.com/2008/11/basic-ocr-in-opencv/ . Puedo extraer con éxito cada personaje individual usando un umbral inteligente. Donde las cosas se ponen un poco complicadas es […]