Назначение

Распознавание форм

FormXtra Capture - распознавание документов

Интеллектуальное распознавание документов (Intelligent Document Recognition) — новая технология, которая обещает изменить способ обработки документов и направлена на извлечение важной информации из деловых и административных документов.

Решение существенно отличается от типовых программ распознавания текста и позволяет обрабатывать сложные документы любого типа и содержания. Ключевые особенности:

  • Компоновка формы бумажного документа и предопределение полей

    Готовые компоненты для распознавания данных любого типа: печатный текст (OCR), рукопечатный текст (ICR), естественный рукописный текст (Parascript ICR), метки (OMR), штрихкоды.

  • Инструменты для настройки

    Устранение углового перекоса, очистка изображение от мелкого мусора, удаление фоновой текстуры, возможность регулирования ошибок и отказов, настройка формата выходных данных.

  • Встроенная среда разработки

    Помимо штатных инструментов можно задействовать дополнительную логику при обработке документов используя языки программирования (C#, VB.Net). Все работы по созданию, тестированию, компиляции кода можно выполнять в пределах FormXtra Capture.

распознавание документов, бланков, накладных, опросных листов. распознавание рукописного текста. FormXtra Capture от Paracript(Параскрипт), Степан Пачиков

Распознавание анкет и бланков

Обилие рукопечатных цифр и слов, наличие меток и подчеркиваний — все это присутствует в анкетах и бланках. Точно также в них присутствуют исправления, шум, рукописный текст (вписывая каждую букву в отдельную размеченную позицию, большинство людей невольно соединяют буквы и начинают писать их слишком близко друг к другу). В итоге, вместо рукопечатного текста анкета может содержать и рукописный. FormXtra Capture - одно из немногих решений, которое позволяет справиться даже с распознаванием естественного рукописного текста. Подробнее о распознавании анкет и бланков.


Распознавание опросных листов

Подобные формы содержат большое количество меток различных вариаций (одиночные метки или размеченные зоны). Кроме задач распознавания и последующего экспорта, необходимо контролировать корректность заполнения опросного листа. В зависимости от требований, документ можно признать недействительным, если респондент ставил несколько меток, где требовалась одна (или не ставил вовсе). Решение позволяет встраивать любую логику при обработке опросных листов, задавая различные правила и исключения. Подробнее о распознавании опросных листов.


Распознавание инвентаризационных ведомостей

Как правило, инвентаризационная ведомость состоит из десятка страниц. На каждой странице присутствует размеченная таблица с большим количеством ячеек, некоторые из них заполняют рукописными цифрами. Однопроходное распознавание не даст приемлемый уровень точности. Решение позволяет задействовать алгоритмы голосования, где одна и та же ячейка распознается несколько раз, после чего их ответы сравниваются. Такой подход значительно повышает точность извлекаемых данных. Подробнее о распознавании инвентаризационных ведомостей.


Распознавание первичных бухгалтерских документов

Отличительной чертой первичных документов (накладных, платежных документов, чеков) являются их визуальные отличия. Накладные отличаются размерами, содержанием, компоновкой таблиц. Соответственно, местоположение полей, которые нужно распознать заранее неизвестно. В таких случаях можно прибегнуть к логическому исследованию документа и последующему динамическому распознаванию. Например, требуется найти и распознать содержимое поля «Сумма». Как правило, это поле расположено в нижней части формы, строкой выше присутствует поле «НДС», а зона для распознавания находится справа от текста «Сумма». Опираясь на подобное описание, можно распознать все объекты такого рода.


 

Сегодня система распознавания форм FormXtra Capture является уникальным интеллектуальным решением с усовершенствованными механизмами обработки и распознавания данных. Это готовый инструмент для офисного использования больших корпораций и маленьких компаний.


Обратная связь