Автоматизация информационных процессов

Интернет, новостные заголовки изобилуют статьями о преимуществе искусственного интеллекта для бизнеса.

Однако, если поговорить о деле - годный контент можно найти не ближе 2 страницы в поисковике.

Маркетологи рекламируют такие термины как «самообучаемость» и «независимость», чтобы привлечь внимание корпоративных клиентов, но какова практическая польза применения от применения машинного обучения для автоматизации информационных процессов организации? Превосходит ли технология ИИ то, что используется сегодня?

Человек VS Машина

Согласно отчету Forrester «The Sorry State of Digital Transformation» в 2018 году, до 22 процентов предприятий по-прежнему имеют бизнес-процессы, далекие от совершенства, несмотря на то, что это - критические аспекты для довольства клиентов и роста доходов предприятия. Если необходимо сократить операционные расходы, повысить лояльность клиентов, и снизить количество ошибок - автоматизация действительно может ответить на часть ваших молитв требований. Мир предоставил бизнесу несколько средств автоматизации информационных процессов (простым языком):

  • Традиционная автоматизация - Человек создает правила, машина исполняет.
  • Автоматизация с ИИ - Человек дает материал - программа разбирается сама.
Давайте рассмотрим пример соответствия кредитной документации для сравнения двух подходов с критической точки зрения. Независимо от типа кредита - автокредита, ипотечного кредита или кредита под залог недвижимости - для удовлетворения требований по заявкам и нормативным требованиям требуется большое количество документов. Проверочные требования к документации выполнены, и обработка документов, содержащих всю необходимую информацию - болезненная и трудоемкая задача. В стремлении минимизировать трудоемкость, многие кредитные организации ищут возможности для упрощения бизнес-процесса.

Традиционная автоматизация информационных процессов

Традиционная автоматизация информационных процессов начинается с мануальной оценки. Правильно управляемый проект требует инвентаризации документов для данного кредитора и типа займа. Затем сотрудники собирают шаблоны всех необходимых документов, изучая различные источники. После, сотрудники организуют сотни полученных документов по типу и анализируют для определения уникальных характеристик - они будут использоваться для автоматической идентификации в типичном рабочем процессе при утверждении кредита.

Как только сотрудники идентифицируют все характеристики документов, эксперт-аналитик формирует алгоритм с использованием характеристик как правила в системе сбора документов. Правила должны быть проверены для выявления любых неправильных классификаций, которые требуют добавления новых правил или точной настройки существующих. После завершения тестирования и тонкой настройки правила переходят в рабочий процесс.

Рабочий процесс

В продолжение автоматизации обработки данных, необходимо создать алгоритм, публикующий необходимые данные в документах до того, как данные могут быть извлечены и проверены. Весь процесс, описанный выше, должен быть повторен, чтобы обеспечить извлечение максимального объема точных данных из документов. Процесс определит - какой процент человеческого вмешательства будет требоваться при обработке информации. Поскольку многие документы не стандартизированы, то количество правил будет более, чем объемным.

Некоторые отраслевые решения предлагают автоматизировать настройку обработки документов на начальном этапе или во время предпроизводственного/производственного процесса. Рабочий процесс включает в себя поиск образцов данного типа документа (может быть, двух или трех) и пошаговое указание программе местоположение каждого необходимого поля - процесс «укажи и щелкни». Если решение поставщика включает в себя предварительно созданный тип документа (например, форму доходов), то многие правила для определения местоположения полей или данных предопределены, и пользователь идентифицирует примеры необходимых полей только там, где данные не были найдены.

Получается, что человек «тренирует» алгоритм. Система включает в себя координаты этих полей и создает новый шаблон для документа. Результатом является сочетание преимуществ традиционной экспертной системы и эффективности машины, получаемой благодаря ее обучению.

Плюсы традиционного средства автоматизации обработки данных:

  • Быстрое и эффективное устранение неисправностей. Алгоритмы определяются и задаются людьми, и логика работы такой программы максимально прозрачна.
  • Высокая точность результатов при наличии стандартизированных документов.
Минусы традиционной автоматизации:

  • Одним из недостатков традиционной автоматизации является время, необходимое для достижения приемлемого уровня автоматизации. Разработка качественного производительного алгоритма на полуструктурированных данных, таких как справки о доходах, определенно требует времени.
  • Другим недостатком является необходимость в наличии эксперта-аналитика в области автоматизации информационных процессов. Крупные организации формируют целые департаменты под такие задачи или отдают исполнение другим компаниям..

Машинное обучение

Та самая замаркетированная часть Искусственного интеллекта, которая может ввести в заблуждение из-за переизбытка поверхностного контента.

Давайте рассмотрим ту же ситуацию с автоматизацией информационных процессов и сбора обработки данных документов для кредитования, но теперь используя технологии машинного обучения. Для первоначальной категоризации документов можно использовать технику, называемую «кластеризация», для автоматизации логической группировки схожих по структуре документов. Документы могут быть организованы автоматически при помощи технологии: заявления могут быть сгруппированы с заявлениями, водительские права сгруппированы с правами, и так далее. Первым результатом является набор документов, сгруппированных по структуре, которые затем могут быть дополнительно разделены по параметрам. Эти группы образуют основу классов документов, которые помещаются в систему, где программное обеспечение автоматически определяет характеристики каждого из них и создает свои алгоритмы.

Обучение «на лету»

Для создания правил по извлечению данных требуются:

  • Большая выборка исходных данных.
  • Чистые данные – примеры корректно заполненных документов без ошибок и неточностей.

Например, пользователь предоставляет системе образец чистых данных. Они позволяют алгоритмам обучаться и находить схожую информацию и создавать позиционные правила для каждого поля данных.

Плюсы:

  • Средства автоматизации информационных процессов создаются самостоятельно и просто, потому что пользователь не создает алгоритм.
  • Новые вводные могут скорректировать алгоритмы, при наличии достаточно объемной выборки и примеров корректных данных.
  • Эксперт-аналитик уже не является таким необходимым звеном

Минусы:

  • Устранение неисправностей неправильного вывода данных является сложной задачей и требует добавления новых выборок и наблюдения за результатами.
  • Если система обучения создает свои собственные правила определения местоположения данных в документе, то может возникнуть больше ошибок в сравнении с прямым указыванием полей, особенно для структурированных документов.
  • Входящим условием для является наличие выборки с большим количеством данных.

Кто выиграл в битве

Как и во многих маркетинговых статьях - никто не победитель. Выгода технологии зависит от размера предприятия и целей, которые оно перед собой ставит. Если вы являетесь, например, крупной организацией с петабайтами данных - автоматизация информационных процессов через искусственный интеллект будет лучшим вариантом.

Если же вы не обладаете огромным массивом выборок - пробуйте автоматизировать документооборот через упрощенные традиционные инструменты автоматизации. Например, Robot ROBIN.

Лучшим решением будет сегментировать задачи и внедрить оба метода автоматизации. Для целей, которые предусматривают строгую типизацию документов логичнее использовать традиционную автоматизацию, но для сохранения ресурсов предприятия для более «гибких» документов лучше использовать машинное обучение.

Читать еще: