| | Взгляд на требования к потоковому вводу финансовых документов | Источник и обсуждение - Станислав Ким, интервью для ECM-Journal, 30 апреля 2010 Работа с документами в электронном виде становится все более и более привычной. Технологии дают все больше преимуществ работы с электронными документами и информацией в электронном виде. Поэтому неудобства работы с большим объемом бумажных документов становится все более очевидным. Но в то же время избавиться совсем от бумажных документов не получается, да и вряд ли получится в ближайшем будущем. Поэтому для многих организаций остро встает вопрос преобразования документов из бумажного вида в электронный. Эту мы попросили осветить Станислава Кима, генерального директора компании АЛЕЕ СОФТВЕР, которая занимается комплексным внедрением электронных архивов финансовой документации более 5 лет.
ECM-Journal. Станислав, скажите, пожалуйста, какие требования необходимо сформулировать, чтобы полноценно решить задачу потокового ввода финансовых документов?
Станислав Ким. Когда речь идет об архивах финансовой документации необходимо изначально понимать, зачем заказчику нужна система с графическими образами финансовой документации и каким образом она может помочь в решении проблем работы с документами. Стоит ли полностью распознавать документы или нужна только часть малая доля информации? Для начала предлагаю разделить задачу наполнения информационной системы на две:
- Сканирование текущей ежедневной документации.
- Сканирование бумажного архива прошлых лет.
Обе они требуют различного подхода и реализации. Если решение первой задачи достаточно понятно и сканирование текущей ежедневной документации чаще всего уже реализовано в различных СЭД на хорошем уровне. Можно отсканировать пакеты документов, завести на них карточки и включить маршрутизацию, т.е. все, что требуется по принятому в компании делопроизводственному обороту. Со вторым возникают определенные трудности. В чем они заключаются?
Сканирование архива прошлых лет представляет собой проект с ограниченными временными, финансовыми, техническими, технологическими и людскими ресурсами. Часто такая задача сложна для самостоятельного выполнения и отдается на аутсорсинг. В большинстве случаев имеющийся архив документов представляет собой определенным образом структурированную совокупность разнородных документов, часть которых может быть сшита без возможности расшивки (контракты с приложениями). Первичная финансовая документация может быть сгруппирована в пакеты по проводкам и транзакциям, скреплена степлером и уложена в пластиковые фолдеры. Документы могут быть разных форматов от минимальных чеков и мелких бланков до А3 формата. Чтобы не сканировать лишние или продублированные документы, часто требуется архивная обработка опытными специалистами, в процессе работы также выявляется некомплект, ошибочная локализация документов и т.д. Современные протяжные документные сканеры имеют скорость сканирования свыше 100 страниц в минуту и лотки на 500 и более листов. Соответственно для обеспечения высокой скорости этапу сканирования предшествует достаточно кропотливая процедура подготовки документов. После сканирования документы необходимо вернуть в изначальное состояние.
ECM-J. Какие специфические требования предъявляют к потоковому вводу разные сферы?
С.К. Например, разные требования к распознаванию документов.
При обработке финансовой документации для автоматизированного атрибутирования, т.е. присвоения метаданных, предлагаются различные системы ICR или системы интеллектуального распознавания. Для больших массивов однотипной документации это актуально, а, например, для отсканированных контрактов – нет. Документы разнородны, некоторые атрибуты, например номер документа и дата нередко прописываются вручную. Полностью распознавать десятистраничный документ для вычленения 5-7 атрибутов задача дорогостоящая и не особо эффективная.
ECM-J. Почему проекты оцифровки больших массивов документов такие сложные и дорогостоящие?
С.К. Решающее значение играют несколько факторов:
- Большое разнообразие, сложность и дороговизна сканирующего оборудования (документные, книжные, протяжные широкоформатные и т.д.)
- Необходимость закупки дополнительной компьютерной техники: мобильные сервера и хранилища, рабочие станции, принтеры и сканеры штрих-кодов.
- Сложный технологический процесс, необходимость обучения сотрудников (менеджеров проектов, сканировщиков, сортировщиков, операторов ввода, менеджеров по контролю качества).
- Необходимость использования разнородного программного обеспечения: программы сканирования, сортеры, ПО графической постобработки, OCR, конвертеры, вьюверы и т.д.
- Каждый массив документов может потребовать свой комплект ПО, аппаратного обеспечения и процедуру обработки. Например, цветные государственные таможенные декларации с карандашными пометками придется сканировать иначе, чем сшитые черно-белые контракты. Но при этом качество документов должно оставаться приемлемым и в электронном виде читаться не хуже чем с бумажного оригинала.
Учитывая все эти сложности и нюансы, сканирование документов произведено и даже присвоены дополнительные атрибуты. Что дальше? Конечно, нужна информационная система, в которую все документы можно загрузить, сформировать к ним необходимые карточки, структурировать, назначить политики безопасности. Назовем данную систему электронным архивом финансовых документов. Конечно, в первую очередь необходима ее интеграция с финансовой учетной системой, кроме этого крайне полезна интеграция архива с CRM системой. Кстати, далеко не каждая СЭД хорошо справится с задачей построения электронного архива - причины могут быть как идеологические, так и архитектурные. Например, любовь некоторых вендоров хранить файлы в СУБД в виде блобов приводит к резкому снижению производительности системы на определенных объемах документов.
Так что для полноценного решения задачи потокового ввода финансовых документов необходимо тщательно проанализировать развитие таких вендоров как EMC Captiva или Kofax, создать (купить) под каждый процесс набор необходимых программных решений и научить весь этот сложный зоопарк слажено работать.
Каждый отдельный проект предъявляет свои специфические требования независимо от вида бизнеса или министерской принадлежности госкомпании. На российском рынке присутствуют компании, как продвигающие высокотехнологичные продукты поточного сканирования, так и сканирующие «на коленке», и каждая находит своего клиента. На сегодняшний день технологиям и средствам потокового ввода не хватает простоты использования и доступности. Нелегко угадать дальнейшие варианты развития рынка, но, по нашим прикидкам, еще несколько лет технологии будут оставаться сложными и дорогостоящими.
| | | |