Articles of ocr

¿Cómo puedo insertar fonts Monospace en una imagen con opencv?

Actualmente, puedo insertar algunos textos de fuente HERSHEY en imágenes con API openCV (putText). Pero parece que openCV no soporta ninguna fuente monoespaciada. Me preguntaba cómo puedo insertar algunos textos de Monospace o de paso fijo en la imagen.

Python: Generación de códigos de barras y contabilización de formularios PDF duplicados

Esto es un poco complicado, así que por favor quédate conmigo. Estoy trabajando en un proyecto de “Vigilancia judicial”, que consiste en pedirles a los voluntarios que lleven formularios con ellos e indicar qué sucede durante un juicio / audiencia en salas específicas. Este es el formulario (redacciones para privacidad). Tenemos cientos de ellos llenos […]

Naipes OCR

Decidí hacer un proyecto por diversión donde quiero tomar como entrada la imagen de una carta de juego y devolver su rango y su palo. Me imagino que solo necesito mirar la esquina superior izquierda, ya que tiene toda la información. Debería ser robusto: si tengo una imagen grande de un As of Diamonds, debería […]

¿Cómo puedo usar el ejemplo de Keras OCR?

Encontré examples/image_ocr.py que parece ser para OCR. Por lo tanto, debería ser posible dar una imagen al modelo y recibir texto. Sin embargo, no tengo idea de cómo hacerlo. ¿Cómo alimentar el modelo con una nueva imagen? ¿Qué tipo de preprocesamiento es necesario? Lo que hice Instalando las dependencias: Instale cairocffi : sudo apt-get install […]

Reconocer imágenes en Python

Soy algo nuevo tanto para el reconocimiento OCR como para Python. Lo que estoy tratando de lograr es ejecutar Tesseract desde un script de Python para ‘reconocer’ algunas figuras en particular en un .tif. Pensé que podía entrenar a Tesseract pero no encontré ningún tema similar en Google y aquí en SO. Básicamente, tengo algunos […]

Procesando una imagen de una tabla para obtener datos de ella.

Tengo esta imagen de una mesa (ver abajo). Y estoy tratando de obtener los datos de la tabla, similar a este formulario (primera fila de la imagen de la tabla): rows[0] = [x,x, , , , ,x, ,x,x, ,x, ,x, , , , ,x, , , ,x,x,x, ,x, ,x, , , , ] Necesito el […]

Limpieza de imagen antes de la aplicación OCR

He estado experimentando con PyTesser durante las últimas dos horas y es una herramienta muy buena. Un par de cosas que noté sobre la precisión de PyTesser: Archivo con icons, imágenes y texto: 5-10% de precisión Archivo con solo texto (imágenes e íconos borrados) – 50-60% de precisión Archivo con estiramiento (y esta es la […]

“Agregando” nuevas fonts a Tesseract eng.traineddata

Por lo que sé, Tesseract 3.x viene con 6 fonts en inglés (corríjame si me equivoco). Necesito entrenar a Tesseract para más 5 tipos de fonts. Solo necesito letras mayúsculas y dígitos (sin caracteres especiales ni símbolos). Seguí varios procesos, por ejemplo: Agregar nuevas fonts al motor OCR de Tesseract 3 y también usé herramientas […]

¿Qué opciones de OCR existen más allá de Tesseract?

He usado Tesseract un poco y los resultados dejan mucho que desear. Actualmente estoy detectando imágenes muy pequeñas (35×15, sin borde, pero he intentado agregar una con imagemgick sin ninguna ventaja); van desde 2 hasta 5 y son una fuente bastante confiable, sin embargo, los caracteres son lo suficientemente variables como para que el simple […]

Detecta el área de texto en una imagen usando python y opencv

Quiero detectar el área de texto de las imágenes usando python 2.7 y opencv 2.4.9 y dibujar un área de rectángulo a su alrededor. Como se muestra en la imagen de ejemplo a continuación. Soy nuevo en el procesamiento de imágenes, así que cualquier idea de cómo hacerlo será apreciada.