Распознавание рукописного текста

Распознавание рукописного текста

Достаточно значимый процент деловых и офисных документов содержит рукописный текст. Согласно исследованиям, эти данные играют ключевую роль и в обязательном порядке попадают в учетные системы путем ручного ввода. Предприятия не пытаются автоматизировать эту работу, в результате, ввод данных отнимает много ресурсов и времени. Почему? Рукописный текст, также как и печатный, можно извлекать из документов, получая при этом максимальную точность. Предлагаемое решение FormXtra Capture, как нельзя лучше, подходит для этих задач. Теперь распознавание рукописного текста, цифр, образов полностью автоматизировано.


Привычные многим программы для распознавания текста отличаются от решений по извлечению данных. И на то есть свои причины. Учетным программам нужны данные, а не редактируемые формы с различными графическими элементами (таблицы, рамки, линии, засечки и логотипы). Для автоматизации ввода требуется подготовительный этап — настройка, где пользователь указывает какую информацию извлекать, как ее обрабатывать, распознавать и экспортировать. Для более детального ознакомления с основными этапами работы (в т.ч. и настройки) системы смотрите схему работы. Мы же сосредоточимся на распознавании рукописного текста в документах, выделяя важные особенности:

  • Использование контекстной информации

    Система не всегда может построить уверенную гипотезу ответа. И причин для этого масса: плохое качество бумажного носителя или скана, цвет пишущего инструмента, слишком связный и неразборчивый почерк. Использование словарей, подобранных с учетом слов и фраз, которые приняты в конкретной отрасли, позволяют существенно улучшить распознавание письменного текста. Словари предоставляют список возможных ответов, которые используются системой, чтобы определить наилучший вариант из возможных. См. также статью: распознавание рукописного текста: cловари и ICR
    распознавание рукописного текста, использование словарей при распознавании рукописного текста

  • Использование регулярных выражений

    Регулярные выражения — крайне полезный инструмент, который можно использовать для распознавания сложных последовательностей символов.
    распознавание рукописного текста, использование регулярных выражений, регулярные выражения в распознавании

  • Использование псевдонимов

    Ошибки в проектировании документа могут приводить к неопределенности при ее заполнении. В результате вместо одного варианта написания появляется множество альтернативных вариантов, которые тоже являются правильными. Для примера: Харкiв, мХаркiв (точка находится в ячейке с буквой "м"), м.Харкiв (точка находится в отдельной ячейке). Более того, специфика различных регионов Украины позволяет смело предположить, что люди заполняют документы на родном языке, игнорируя требования и основной язык документа. Пример: Харьков, гХарьков, г.Харьков. Использование псевдонимов (alias) позволяет преобразовать все ответы распознавателя к единственно правильному ответу.
    распознавание рукописного текста, использование псевдонимов, использование alias

  • Использование скриптов (бизнес-правил)

    Скрипты применяют в качестве логического инструмента при распознавании. Они используют теории имплекации (if, else) или сценариев (use, case) для определения следующего корректного ответа или подтверждения достоверности одного или нескольких полей. Распространенной областью применения является автоматическое заполнение полей с поиском в базе данных (например, если код 00123, то имя, адрес и телефон автоматически должны быть х, у, z).
    распознавание рукописного текста, SDK, C#, использование скриптов при распознавании рукописного текста

  • Алгоритмы голосования

    Достаточно часто к извлекаемому рукописному полю предъявляют повышенные требования к точности распознавания. В подобных случаях имеется возможность распознавать одно и тоже поле разными способами или движками (ABBYY FineReader Engee, CuneiForm и прочие), а после, сравнивать ответы для нахождения истины.
    распознавание рукописного текста, очистка полей при распознавании рукописного текста, алгоритмы голосования при распознавании рукописного текста


Решения и услуги, которые мы предлагаем, позволяют обрабатывать документы гораздо быстрее и эффективнее. Избавьте Ваше предприятие от сложной, рутинной и малоинтересной работы.
Мы умеем распознавать рукописный текст лучше других!


автоматизация ввода документов, распознавание документов, распознавание рукописного текста   услуги распознавания и ввода документов, распознавание рукописного текста