Articles of ocr

Python: Cómo hacer caracteres OCR cruzados por una línea horizontal

Tengo un lote de imágenes que me gustaría escanear. Algunos de ellos tienen una línea horizontal que cruza los caracteres que deben ser escaneados, que se verían así: He hecho un progtwig que es capaz de eliminar la línea horizontal: import cv2 import numpy as np img = cv2.imread(‘image.jpg’,0) # Applies threshold and inverts the […]

Python, pyPdf, error de Adobe OCR en PDF: filtro / lzwdecode no compatible

Mis cosas: python 2.6 64 bit (con pyPdf-1.13.win32.exe instalado). Ala IDE. Windows 7 64 bit. Tuve el siguiente error: Error no implementado: filtro no compatible / LZWDecode Cuando ejecuté el siguiente código: from pyPdf import PdfFileWriter, PdfFileReader import sys, os, pyPdf, re path = ‘C:\\Users\\Homer\\Documents\\’ # This is where I put my pdfs filelist = […]

Biblioteca de python simple para el texto de reconocimiento de la imagen

Estoy buscando una biblioteca de python simple para el reconocimiento de texto de imágenes. Las imágenes son similares a esto: La imagen contiene una imagen muy pura y simple: una línea, números y guiones, pero la resolución es baja. Me gustaría algo similar (en un ideal): text = recognize(open(‘image.png’, ‘rb’).read()) ¿Existe algo similar? Gracias. UPD […]

TensorFlow: los parámetros no se actualizan al entrenar

Estoy implementando un modelo de clasificación usando TensorFlow El problema al que me estoy enfrentando es que mis pesos y errores no se actualizan cuando ejecuto el paso de entrenamiento. Como resultado, mi red sigue devolviendo los mismos resultados. He desarrollado mi modelo basado en el ejemplo MNIST del sitio web TensorFlow. import numpy as […]

OpenCV MSER detecta áreas de texto – Python

Tengo una imagen de factura y quiero detectar el texto en ella. Así que planeo usar 2 pasos: primero es identificar las áreas de texto, y luego usar OCR para reconocer el texto. Estoy usando OpenCV 3.0 en python para eso. Soy capaz de identificar el texto (incluyendo algunas áreas que no son de texto) […]

usa pytesseract para reconocer el texto de la imagen

Necesito usar pytesseract para extraer texto de esta imagen: y el código: from PIL import Image, ImageEnhance, ImageFilter import pytesseract path = ‘pic.gif’ img = Image.open(path) img = img.convert(‘RGBA’) pix = img.load() for y in range(img.size[1]): for x in range(img.size[0]): if pix[x, y][0] < 102 or pix[x, y][1] < 102 or pix[x, y][2] < 102: […]

Python OCR Module en Linux?

Quiero encontrar un módulo de Python OCR fácil de usar en linux, he encontrado pytesser http://code.google.com/p/pytesser/ , pero contiene un archivo ejecutable .exe. Intenté cambiar el código para usar el vino, y realmente funciona, pero es demasiado lento y no es una buena idea. ¿Hay alguna alternativa de Linux que sea tan fácil de usar […]

¿Cómo elijo entre Tesseract y OpenCV?

Recientemente me encontré con Tesseract y OpenCV . Parece que Tesseract es un motor de OCR completo y OpenCV puede usarse como marco para crear una aplicación / servicio de OCR. Intenté usar Tesseract en algunas de mis imágenes y su precisión parece decente. Más tarde, encontré un tutorial muy simple sobre el uso de […]

Pytesser en Python 3.4: el nombre ‘image_to_string’ no está definido?

En primer lugar, me gustaría decir que sé que pytesser no es para Python 3.4, pero leí en http://sofes.miximages.com/python/textArea01.png’) No hay problemas allí, pero cuando uso print (image_to_string(image)) se le ocurre esto: Traceback (most recent call last): File “”, line 1, in print (image_to_string(image)) NameError: name ‘image_to_string’ is not defined

Biblioteca OCR de Python o motor de reconocimiento de caracteres manuscritos

¿Podría recomendar algunas bibliotecas de Python o código fuente para OCR y reconocimiento de caracteres manuscritos?