Articles of ocr

Detección de texto en imágenes.

Estoy usando el código de ejemplo que se encuentra debajo para la detección de texto en imágenes (no manuscritas) usando coreml y vision. https://github.com/DrNeuroSurg/OCRwithVisionAndCoreML-Part2 En esto, han utilizado un modelo de aprendizaje automático que solo admite mayúsculas y números. Donde, como en mi proyecto, quiero mayúsculas, minúsculas, números y pocos caracteres especiales (como:, -). No […]

OCR de texto de baja resolución de capturas de pantalla

Estoy escribiendo una aplicación OCR para leer caracteres de una imagen de captura de pantalla. Actualmente, me estoy centrando sólo en los dígitos. Estoy basando parcialmente mi enfoque en esta publicación de blog: http://blog.damiles.com/2008/11/basic-ocr-in-opencv/ . Puedo extraer con éxito cada personaje individual usando un umbral inteligente. Donde las cosas se ponen un poco complicadas es […]

Extraer tablas de un pdf

Estoy tratando de obtener los datos de las tablas en este PDF . He intentado pdfminer y pypdf con un poco de suerte, pero realmente no puedo obtener los datos de las tablas. Así es como se ve una de las tablas: Como puede ver, algunas columnas están marcadas con una ‘x’. Estoy tratando de […]

¿Cómo puedo insertar fonts Monospace en una imagen con opencv?

Actualmente, puedo insertar algunos textos de fuente HERSHEY en imágenes con API openCV (putText). Pero parece que openCV no soporta ninguna fuente monoespaciada. Me preguntaba cómo puedo insertar algunos textos de Monospace o de paso fijo en la imagen.

Python: Generación de códigos de barras y contabilización de formularios PDF duplicados

Esto es un poco complicado, así que por favor quédate conmigo. Estoy trabajando en un proyecto de “Vigilancia judicial”, que consiste en pedirles a los voluntarios que lleven formularios con ellos e indicar qué sucede durante un juicio / audiencia en salas específicas. Este es el formulario (redacciones para privacidad). Tenemos cientos de ellos llenos […]

Naipes OCR

Decidí hacer un proyecto por diversión donde quiero tomar como entrada la imagen de una carta de juego y devolver su rango y su palo. Me imagino que solo necesito mirar la esquina superior izquierda, ya que tiene toda la información. Debería ser robusto: si tengo una imagen grande de un As of Diamonds, debería […]

¿Cómo puedo usar el ejemplo de Keras OCR?

Encontré examples/image_ocr.py que parece ser para OCR. Por lo tanto, debería ser posible dar una imagen al modelo y recibir texto. Sin embargo, no tengo idea de cómo hacerlo. ¿Cómo alimentar el modelo con una nueva imagen? ¿Qué tipo de preprocesamiento es necesario? Lo que hice Instalando las dependencias: Instale cairocffi : sudo apt-get install […]

Reconocer imágenes en Python

Soy algo nuevo tanto para el reconocimiento OCR como para Python. Lo que estoy tratando de lograr es ejecutar Tesseract desde un script de Python para ‘reconocer’ algunas figuras en particular en un .tif. Pensé que podía entrenar a Tesseract pero no encontré ningún tema similar en Google y aquí en SO. Básicamente, tengo algunos […]

Procesando una imagen de una tabla para obtener datos de ella.

Tengo esta imagen de una mesa (ver abajo). Y estoy tratando de obtener los datos de la tabla, similar a este formulario (primera fila de la imagen de la tabla): rows[0] = [x,x, , , , ,x, ,x,x, ,x, ,x, , , , ,x, , , ,x,x,x, ,x, ,x, , , , ] Necesito el […]

Limpieza de imagen antes de la aplicación OCR

He estado experimentando con PyTesser durante las últimas dos horas y es una herramienta muy buena. Un par de cosas que noté sobre la precisión de PyTesser: Archivo con icons, imágenes y texto: 5-10% de precisión Archivo con solo texto (imágenes e íconos borrados) – 50-60% de precisión Archivo con estiramiento (y esta es la […]