Зміст

Распознавание текста (Optical character recognition - OCR) в ОС GNU/Linux

Tesseract

tesseract -l rus page.png page_text
tesseract -l rus --psm 4 page.png page_text

Полезные ссылки

Программы

Tesseract-OCR Распознование русского языка при помощи tesseract OCR

OpenOCR.org

Cuneiform

OOCR

Ocrad (GNU OCR)

ClaraOCR

ocre

GOCR

Kognition

On-Line сервисы

FreeOCR on-line

OnlineOCR

NewOCR

Дистрибутивы (серверы)

WatchOCR