Без купюр: как создаются государственные информационные ресурсы

Без купюр: как создаются государственные информационные ресурсы

В последнее время для нас стали привычными многие государственные услуги и сервисы. А между тем за сроками выдачи водительских удостоверений день в день, получением копий свидетельств о рождении и правоустанавливающих документов в МФЦ, отменой бумажных свидетельств о регистрации права собственности стоит скрытая, но титаническая работа по созданию и наполнению государственных реестров и баз данных.

Первая и ключевая задача государственного управления, развития информационного общества и цифровой экономики — создание эталонных реестров и регистров.

Полные и достоверные сведения в реестрах, не требующие дополнительного документального подтверждения, обеспечивают качественный учет объектов и субъектов, подтверждение прав граждан и юридических лиц. Это напрямую способствует повышению доходов бюджета, развитию социальной сферы, безопасности и экономики.

Надо оцифровывать

Основная проблема в том, что значительная часть реестровой информации до сих пор находится в бумажных архивах, которые нужно перевести в цифровой формат.

Значительные шаги в этом направлении уже сделаны держателями базовых государственных информационных ресурсов: МВД, ФНС, Пенсионным фондом и другими ведомствами. Но до конца пути еще очень далеко.

Например, в соответствии с Указом Президента РФ от 15.01.2016 № 13 и Федеральным законом от 23.06.2016 № 219-ФЗ создается Единый государственный реестр ЗАГС, который станет одним из ключевых ресурсов и позволит перейти на новый уровень государственного учета и услуг. Так при выдаче свидетельства о рождении ребенок будет автоматически прикреплен к поликлинике, записан в очередь в детский сад, к нему будут применяться положенные социальные льготы и налоговые вычеты для его родителей. Новая электронная система позволит упростить и другие процессы, связанные с изменением социального статуса граждан.

Уже в 2018 году в реестр должны начать загружаться сведения из информационных систем органов ЗАГС по регионам, а к 2020 году реестр должен быть сформирован полностью. Проблема в том, что в большинстве случаев в электронном виде есть данные лишь за последние 15 — 20 лет, то есть те, что были заведены сотрудниками с момента внедрения информационной системы. Остается не у дел огромный бумажный архив, исчисляемый миллионами бумажных листов, которые нужно перевести в цифровой вид.

Актовая запись — сложнейший с точки зрения прочтения и извлечения информации документ, содержащий рукописный текст, часто ветхий и выцветший, с зачеркиваниями и исправлениями.

Пример ЗАГС обнажает вопросы, общие для любых задач наполнения государственных реестров

Два вопроса

— Как оцифровать такой большой объем сложных данных, соблюдая ФЗ № 152 «О персональных данных»?

— Как не допустить ошибок? Ведь все мы понимаем, чем в каждом конкретном случае чреваты для гражданина опечатки в имени, фамилии или дате рождения.

Каждую задачу наполнения реестров и информационных систем, а тем более задачи государственного масштаба, необходимо рассматривать как сложный трудоемкий проект. Особенно учитывая традиционно сжатые сроки, определяемые бюджетным периодом, а также актуальные для сегодняшнего дня вопросы экономии.

Прямой ввод данных

Самый простой способ наполнения — перепечатывать сведения с бумаги прямо в систему. К сожалению, у такого подхода есть недостатки:

— Невозможность проверки вносимой информации и, как следствие, вероятность ошибок ввода данных по причине человеческого фактора.

— Низкая скорость ввода: для оцифровки большого объема необходимо расширение штата, что в текущих условиях мало кто может себе позволить.

К тому же в случае самостоятельного ввода приходится отвлекать компетентных и дорогостоящих специалистов в ущерб их основной деятельности. Есть примеры, когда таким образом за 7 лет самостоятельного наполнения органам власти удавалось обработать только 15 — 20% от необходимого объема данных.

Гораздо эффективнее для задач массового ввода становится аутсорсинг

Компания-аутсорсер обычно подбирает и обучает местных сотрудников, разрабатывает под проект специальные программы для минимизации ошибок за счет использования справочников (исторические и актуальные адреса, ФИО), автоматической проверки длины и форматов вносимых сведений (например, длины ИНН).

Но даже такой аутсорсинг не позволяет оцифровать миллионный массив за полгода. Очень дорого обойдется организация работы нескольких тысяч операторов на территории органа власти.

Когда надо обрабатывать большие массивы документов и данных, тем более государственной важности, применяются другие подходы.

Технологии массовой оцифровки

Наполнение государственных регистров — это исключительно услуги крупных специализированных компаний, у которых есть технологии, позволяющие снижать стоимость обработки за единицу и проверять данные перед загрузкой. Такие компании дают гарантию на результат.

Вот как процесс массовой оцифровки документов, в том числе конфиденциальных, описывают в корпорации ЭЛАР.

1. Сначала документы оперативно сканируются на территории заказчика. Включение этапа сканирования позволяет не изымать оригиналы документов из текущей деятельности ведомства. И главное — проводить весь дальнейший процесс индексирования (извлечения данных) в удаленном режиме, без необходимости доступа к оригиналам документов.

2. Так как почти всегда обрабатываются конфиденциальные документы и персональные данные, используется специальная технология: на территории органа власти устанавливается сертифицированный программно-аппаратный комплекс, функция которого — разрезать отсканированные изображения на единичные обезличенные фрагменты перед индексированием.
База данных, способная объединить обезличенные данные в единую запись (например, имя и фамилию в ФИО), остается на территории ведомства и защищена от несанкционированного доступа.

3. Фрагменты изображений на зашифрованном диске или через защищенный канал связи отправляются на обработку в Центр индексирования. Эта инфраструктура сочетает комплекс программных средств извлечения данных и несколько тысяч штатных операторов ручного ввода, что в совокупности дает возможность обрабатывать любые данные, в том числе рукописные, поврежденные, на иностранных языках и т.д.

Центр индексирования — это технологии и ресурсы извлечения данных, способные справиться с задачей оцифровки любого масштаба

Операторы работают по принципу конвейера — каждый отвечает за свой набор данных, что повышает скорость и качество работ.

4. В завершение оцифровки данные проверяются и нормируются, то есть приводятся к заданному формату написания. Например, из опыта создания ФИАС известно, что один и тот же адрес может быть написан 18 разными способами! Соответственно, надо привести его к единообразию.

Снова задача решается наличием операторов ввода, способных компетентно, по заданным регламентам, проверить и скорректировать данные.

И только выверенный ресурс загружается в государственный регистр или реестр

Работы должны продолжаться

Создание эталонных реестров — важнейшая задача для государства и общества. Задача осознана и внесена во многие государственные и целевые программы, ответственными ведомствами уже подготовлены программные платформы и частично сформированы ресурсы.

Работу просто необходимо продолжать, так как именно отсутствие полной и аутентичной информации тормозит достижение стратегической цели повышения эффективности государственного управления.

Например, более 10 лет назад частичный перевод в цифровой вид оперативно-справочных картотек МВД позволил в некоторых регионах в разы сократить сроки выдачи загранпаспортов и еще более 20 государственных услуг, требовавших подтверждения законопослушности граждан. А как же оставшиеся субъекты РФ?

Заморожена предусмотренная ФЦП оцифровка массивов документов Росреестра и Кадастровой палаты, хотя наполнения информацией требуют и АИС ГКН, и создаваемая ФГИС ЕГРН с предусмотренным хранилищем для электронных документов.

Технологии отработаны: в 2016 году путем оцифровки более 1 000 000 комплектов документов наполнен Государственный кадастр недвижимости по Республике Крым и Севастополю. С десятков тысяч людей была снята необходимость обязательной перерегистрации собственности.

ФНС, являясь самой продвинутой в части реестров службой, до сих пор строит ангары для хранения регистрационных дел налогоплательщиков и вместо сканирования тратит колоссальные средства на обслуживание этих бумажных массивов.

Нет и единого реестра для поиска и работы с текстами государственных стандартов...

Впереди целый пласт нерешенных задач. Главное — не останавливаться. Как говорил Марк Анней Лукан: «Если осталось еще что-нибудь доделать, считай, что ничто не сделано».


Возврат к списку