Возникла «Проблема реквизитов»: документы зарегистрированы и могут быть найдены по номеру, дате, подписанту, но при этом вся значимая информация о физлицах, юрлицах, адресах и пр. содержится в приложениях и непосредственно в текстах.
Неполнота поисковых индексов приводит к выпадению документов из результатов поиска, невозможности составить полный и достоверный комплект документации по объекту или субъекту.
Проблема свойственна абсолютно всем видам и типам документов: обращениям граждан, распорядительным документам администраций, корпоративным приказам по внутренней деятельности, делам, клиентским досье и т.д.
Как сделать так, чтобы сотрудник, набрав поисковое слово, увидел не 100 строк поисковой выдачи, а один целый комплект актуальных документов? Для этого массив надо подготовить.
В случае обработки многотысячных и миллионных электронных ресурсов требуются особые технологии.
Интеллектуальная обработка
Мы предлагаем уникальные услуги Интеллектуальной обработки электронных массивов:
- Специальные алгоритмы проанализируют документы, найдут и извлекут все значимые ключевые слова и смысловые сущности
- Все извлеченные данные будут проверены и нормированы (приведены к заданному формату написания) в программном и ручном режиме.
Технология применяется как для обработки уже имеющихся массивов электронных документов в информационных системах, так и для массивов электронных образов, полученных в результате массового сканирования.
Алгоритмы интеллектуального индексирования также встраиваются нами в создаваемые информационные системы, где отвечают за установление взаимосвязей загружаемых документов с существующим ресурсом.
Пример 1: В едином электронном архиве Телеком-оператора ежедневно сохраняются миллионы документов по всему профилю деятельности. Каждый документ автоматически индексируется по присутствующим в его тексте сущностям. Реквизиты нормируются (приводятся к нужному формату написания). Оператор Call-центра при входящем звонке автоматически видит все самые актуальные документы по клиенту — в том числе свежий заказ-наряд на проведение ремонтных работ на данном участке.
Пример 2: Министерство ежедневно выпускает десятки приказов, постановлений и нормативных документов. Встроенная в информационно-правовую систему технология позволяет автоматически найти все документы, изменяемые новым постановлением, внести сами изменения, сформировать гиперссылки между документами. Значительно повышается эффективность сотрудников.
Подготовка контента обеспечивает большее качество нахождения информации по сравнению с развитием полнотекстового поиска, так как:
- Десятки вариантов написания одной и той же сущности (например, адреса), а также ошибки распознавания текстов, исключат часть данных из поиска
- Разработка глубоких семантических и морфологических правил для 100% качества поиска возможна только в более дорогих поисковых движках и потребует больших трудовых и финансовых затрат.
Технологии интеллектуального извлечения данных вместе с наличием штата операторов ручного ввода позволяют ЭЛАР:
- Оперативно реализовывать масштабные проекты
- Обрабатывать печатные документы и тексты любой структуры
- Индексировать массивы документов со значительно меньшими затратами по сравнению с ручным вводом.
Реализация проекта может потребовать доработки существующей информационной системы — добавления новых ключевых полей в карточки документов и механизмов поиска (как минимум по этим ключевым полям).
Построение гиперссылок (альтернативная навигация)
Зачастую обеспечить удобный поиск документов посредством реквизитов невозможно. Гораздо более эффективным и удобным средством навигации становится создание гиперссылок между документами и их фрагментами.
ЭЛАР предлагает комплексные услуги программного и ручного анализа документных массивов, установления взаимосвязи информации, связи информации гиперссылками по образам и текстам (Office, PDF, Jpeg, Tiff и пр.).
Мы обладаем уникальными технологиями построения гиперссылок не только между записями БД, текстами документов и конкретными файлами, но и между фрагментами графических файлов.
Технология применима для любых массивов электронных документов, в том числе содержащих много графических файлов, текст которых не подлежит распознаванию:
- Нормативно-справочные системы. Мы установим взаимосвязи: гиперссылки на изменяющие и изменяемые акты (конкретные абзацы), гиперссылки на версии и пр. Вы сможете получать актуальные версии документов на любую дату.
- Управленческая документация. Мы установим взаимосвязи между любыми ОРД и кадровыми документам. Вы непосредственно из текстов или фрагментов графических документов сможете переходить на анкеты сотрудников, документы подразделений, разделы корпоративной базы знаний и т.д.
- Техническая документация. Различные варианты реализации, вплоть до получения полного комплекта документов по объекту (изделию) путем клика на соответствующее место в гигантском jpeg-файле чертежа.
- Архивные документы, книги и музейные экспонаты. Вы сможете из результатов поиска переходить на конкретную страницу электронной книги или дела с нужным произведением или фрагментом текста. По клику на изображение картины или экспоната открывать детализированные фрагменты со значимыми артефактами и т.д.
Мы накопили передовой опыт и технологии проведения таких работ, реализуя крупнейшие национальные проекты:
- Обеспечили просмотр конкретной записи о персоналии в наградных списках и листках потерь, связали исторические и современные карты для отслеживания боевых путей на портале «Память Народа»
- Реализовали навигацию между конкретными произведениями многостраничных книг в рамках создания Национальной электронной библиотеки.
Построение гиперссылок — действительно эффективный и недорогой в реализации механизм навигации, подходящий для структуризации и интуитивного поиска информации в массивах нормативно-справочной, регламентирующей, технической, землеустроительной и прочей документации. По результатам поиска вы сразу видите нужный документ или абзац в нужном документе-приложении.