-
Добрый вечер.
Подскажите хочу использовать эту библиотеку для распознавания текста. Нашел компонент под Delphi Winsoft OCR. К сожалению он платный. Выяснил что он использует tesseract-ocr.
Подскажите как его приспособить под Delphi, для дальнейшего использования?Желательно чтобы юзеру не приходилось потом качать эту библиотеку и устанавливать ее.
-
-
Всем Спасибо ) Почти все получилось. Вот только иногда путает 3 и 8, 7 и 1, 6 и 5 потому что цифры под разным углом и немного разным размером. Кто знает как выяснить угол поворота цифры и вернуть ее в правильное положение?
-
deskew алгоритм
-
а что хоть распознаешь? какие-то реальные печатные формы или так, для баловства?
-
Капчу )
-
Сейчас к сожалению определение примерно 40%.
Выяснил что шрифт Arial. Угол наклона от -17 до 17. Размер шрифта от 15 до 20. Цифр всегда 5.
Вот хочу чтобы tesseract не ошибался. Потому что из-за того что 0 под наклоном и сверху нету черточки у нуля он его распознает как 1 )) Хотя и так понятно что там 1.
-
Хм. Капча нынче такая пошла, что ее часто и человек не может понять, иногда на некоторых сайтах раз по 10 приходится запрашивать новую капчу, в надежде что она будет понятнее чем старая. что уже говорить о програмном распознавании... :(
-
И все же думаю можно добиться распознавания порядка 90% )
-
действуй!