Конференция "Сети" » Распознавание картинки с помощью tesseract-ocr
 
  • Редиска (04.11.12 00:33) [0]
    Добрый вечер.
    Подскажите хочу использовать эту библиотеку для распознавания текста. Нашел компонент под Delphi Winsoft OCR. К сожалению он платный. Выяснил что он использует tesseract-ocr.
    Подскажите как его приспособить под Delphi, для дальнейшего использования?Желательно чтобы юзеру не приходилось потом качать эту библиотеку и устанавливать ее.
  • Редиска (04.11.12 20:30) [1]
    Не ужели никто не знает?
    Вот страница проекта http://code.google.com/p/tesseract-ocr/
  • Редиска (05.11.12 18:39) [2]
    Всем Спасибо ) Почти все получилось. Вот только иногда путает 3 и 8, 7 и 1, 6 и 5 потому что цифры под разным углом и немного разным размером. Кто знает как выяснить угол поворота цифры и вернуть ее в правильное положение?
  • Цукор5 (06.11.12 00:33) [3]
    deskew алгоритм
  • Цукор5 (06.11.12 00:34) [4]
    а что хоть распознаешь? какие-то реальные печатные формы или так, для баловства?
  • Редиска (06.11.12 01:33) [5]
    Капчу )
  • Редиска (06.11.12 01:37) [6]
    Сейчас к сожалению определение примерно 40%.
    Выяснил что шрифт Arial. Угол наклона от -17 до 17. Размер шрифта от 15 до 20. Цифр всегда 5.
    Вот хочу чтобы tesseract не ошибался. Потому что из-за того что 0 под наклоном и сверху нету черточки у нуля он его распознает как 1 )) Хотя и так понятно что там 1.
  • Очень злой (06.11.12 02:33) [7]
    Хм. Капча нынче такая пошла, что ее часто и человек не может понять, иногда на некоторых сайтах раз по 10 приходится запрашивать новую капчу, в надежде что она будет понятнее чем старая. что уже говорить о програмном распознавании... :(
  • Редиска (06.11.12 02:54) [8]
    И все же думаю можно добиться распознавания порядка 90% )
  • brother © (06.11.12 05:08) [9]
    действуй!
 
Конференция "Сети" » Распознавание картинки с помощью tesseract-ocr
Есть новые Нет новых   [134435   +9][b:0][p:0]