Общий центр обслуживания (ОЦО) "Ростелекома" протестировал российский облачный сервис BeorgSmartVision для автоматического распознавания, оцифровки и анализа документов с применением технологий искусственного интеллекта (ИИ). По итогам пилотного проекта система распознала и автоматически проанализировала 72% от пилотного объема документов сегмента B2B компании.Планируется, что при полноценном внедрении решения эти показатели превысят 80%.
С помощью платформы были оцифрованы слабоструктурированные документы ОЦО "Ростелекома", а все данные из них автоматически перенесены в информационную систему компании. Нейросеть также проверила актуальность договоров, определила наличие необходимых подписей, печатей, дат и реквизитов. Таким образом, была частично реализована функция по автоматической проверке юридической значимости документов. Эту аналитическую работу обычно выполняют сотрудники компании.
Информация и персональные данные при оцифровке были зашифрованы и защищены механизмом деперсонализации: перед обработкой документы разрезались на отдельные фрагменты, по которым невозможно установить их принадлежность. Скорость распознавания одного документа составила около 20 секунд.
Благодаря двухэтапному распознаванию платформа с высокой точностью обработала также данные в договорах, заполненных от руки. Рукописный текст, который современные ИИ-системы распознают с низким порогом уверенности, уходил на вторичную верификацию операторам ввода данных, удаленно подключенным к облачному сервису. Люди сверяли фрагменты распознанного текста и вносили правки в случае ошибок. В результате общее качество распознавания документов составляет почти 100%.
Сервис автоматического распознавания, оцифровки и анализа документов с применением технологий искусственного интеллекта разработала компания "Биорг", резидент ИТ-кластера фонда "Сколково". Всего на платформе обрабатывается около 5 млн полей с персональными данными в месяц.
"При масштабировании проекта компания сможет снизить операционные затраты на 56% за счет автоматизации распознавания и ввода атрибутов, необходимых для регистрации документа в системе. Отечественное решение компании “Биорг” полностью соответствует требованиям безопасности ФСТЭК и ФСБ к обработке персональных данных. В дальнейшем мы планируем дополнительно защитить обрабатываемую информацию. Так, верификаторами слабораспознанных рукописных данных будут выступать наши же сотрудники, а сама система будет развернута в нашем корпоративном облаке", — сказал директор департамента филиала ОЦО "Ростелекома"Павел Шмидт.
"В идеале система на основе платформы BeorgSmartVision оставит за человеком только финальное решение о приемке документов. С рутинной и объемной работой нейросети справляются гораздо лучше людей, которых долгий монотонный труд приводит к выгоранию, изнуряет. Эффективность и окупаемость решения целесообразно оценивать на масштабных потоках документов, поскольку искусственный интеллект наилучшим образом подходит для обработки и анализа больших данных. Это может быть несколько миллионов документов в год", — сказал директор по развитию компании "Биорг" Александр Коробов.
В настоящее время "Ростелеком" проводит конкурс на полномасштабное внедрение технологии, по итогам которого решение будет масштабировано на все документоемкие процессы компании. Срок внедрения полноценной системы распознавания и анализа может составить около полугода.