Документы и workflow

Чат-ассистент для обработки PDF-замечаний и ведения реестра MDR

Разработали внутреннего чат-ассистента, который принимает PDF с замечаниями, извлекает данные, записывает их в MDR-реестр и возвращает готовый XLSX без ручного переноса.

Документы и экран ноутбука как обложка кейса по автоматизации обработки PDF-замечаний

Проблема

Команда тратила слишком много времени на ручной перенос замечаний из PDF в реестр MDR и регулярно упиралась в ошибки из-за человеческого фактора.

Что сделали

Встроили в Bitrix24 чат-ассистента, который принимает PDF, задаёт уточняющие вопросы, извлекает данные из аннотаций и штампов и автоматически формирует записи в MDR.

Результат

Существенно сократили долю ручной работы, снизили ошибки при переносе замечаний и сделали сценарий обработки единым для всей команды.

Контекст кейса

Ниже кейс описан в портфельном формате с учетом NDA. Название компании, названия объектов, внутренние таблицы и часть бизнес-терминов обезличены. Формулировки сохранены максимально близко к реальной задаче и архитектуре решения.


Кто заказчик

Крупная проектно-инжиниринговая компания.


Сегмент / отрасль

B2B, промышленное и гражданское проектирование, сопровождение проектной и рабочей документации, работа с замечаниями по чертежам и реестрами MDR.


Краткие бизнес-характеристики

Заказчик ведет несколько параллельных проектов, в которых команды регулярно обмениваются PDF-файлами с аннотациями и замечаниями по листам рабочей документации. Существенная часть операционной работы связана не с созданием замечаний, а с их переносом в единый реестр, уточнением проекта, определением источника замечания и последующей загрузкой данных в корпоративные таблицы.

Процесс был чувствителен к человеческому фактору: сотрудники работали с большим количеством PDF-файлов, одинаковых по формату, но разных по проектам, шифрам, стадиям и структуре штампа. Ошибка в одном поле могла привести к неверной записи в MDR и дополнительной ручной перепроверке.


Зачем заказчик обратился

Заказчику требовалось сократить ручную работу по переносу замечаний из PDF в структурированный реестр и убрать из процесса рутинные операции:

  • ручное чтение комментариев и штампов в PDF;
  • перенос текста замечаний по строкам в реестр;
  • заполнение повторяющихся служебных полей;
  • уточнение проекта и источника замечаний в переписке;
  • формирование итогового XLSX для передачи дальше по процессу.

Нужно было получить рабочий инструмент прямо в привычной коммуникационной среде команды, без отдельного кабинета и без необходимости обучать пользователей новой системе.


Проблема (боль клиента)

  • Замечания жили в PDF, а реестр велся отдельно, поэтому сотрудники дублировали данные вручную.
  • На один комплект файлов уходило непропорционально много времени из-за копирования, проверки шифров, листов, разделов и авторов замечаний.
  • В разных MDR-таблицах колонки были названы по-разному, из-за чего даже корректно извлеченные данные нельзя было надежно записывать без дополнительной логики.
  • Один и тот же бизнес-процесс зависел от внимательности конкретного исполнителя: ошибка при переносе замечания, проекта или шифра приводила к повторной ручной проверке.
  • Пользователю приходилось помнить допустимые значения вроде источника замечания, вместо того чтобы проходить сценарий пошагово.

Цель проекта

Что заказчик ожидал получить

Внутреннего чат-ассистента в Bitrix24, который:

  • принимает PDF с замечаниями прямо из чата;
  • ведет пользователя по короткому сценарию уточнения данных;
  • извлекает комментарии, листы, шифры, разделы и данные из штампа;
  • автоматически записывает замечания в целевой MDR-реестр;
  • формирует и возвращает итоговый XLSX-файл;
  • работает в корпоративном контуре без отдельного пользовательского интерфейса.

Условия успеха / KPI

  • Сокращение времени на обработку одного комплекта PDF с замечаниями с ручного сценария до короткого диалога в чате.
  • Снижение количества ошибок при переносе замечаний в MDR.
  • Единообразное заполнение реестра вне зависимости от исполнителя.
  • Поддержка нескольких проектов, нескольких PDF в одном сценарии и отличающихся шаблонов Google-таблиц.
  • Возможность промышленного использования в serverless-контуре без локального хранения файлов.

Решение

1. Анализ операционного сценария и проектирование workflow

Сначала был формализован реальный пользовательский путь:

  1. сотрудник отправляет PDF в чат;
  2. бот уточняет, от кого замечание;
  3. бот уточняет, к какому проекту относится файл;
  4. система подбирает нужный MDR;
  5. замечания автоматически извлекаются, нормализуются и записываются в реестр;
  6. пользователю возвращается готовый XLSX.

На этом этапе важной задачей было не просто “распарсить PDF”, а привести весь процесс к предсказуемому сценарию с минимальным количеством двусмысленностей.

2. Разработка чат-ассистента внутри Bitrix24

Был реализован серверный Bitrix24-бот, работающий через события ONIMBOTMESSAGEADD. Пользовательский сценарий перенесен в диалоговый workflow:

  • бот принимает PDF-файлы из чата;
  • сохраняет контекст сценария в базе;
  • задает уточняющие вопросы по шагам;
  • использует кнопки для выбора там, где важно стандартизировать ответ;
  • корректно обрабатывает повторную загрузку файла до старта обработки;
  • защищает сценарий от дублей и повторной обработки одного и того же события.

3. Извлечение замечаний и метаданных из PDF

Ядро решения построено на анализе PDF-аннотаций и текстовой структуры документа. Система:

  • извлекает текстовые комментарии из PDF-аннотаций;
  • определяет автора замечания из аннотации;
  • определяет номер листа, шифр и раздел;
  • извлекает данные из штампа, включая наименование здания/сооружения и исполнителя;
  • поддерживает более одного PDF в одном сценарии;
  • обрабатывает разные форматы шифров и неоднородные штампы.

Отдельно была реализована дополнительная логика, чтобы не путать значения полей штампа с подписями полей или фамилиями сотрудников, а также чтобы корректно работать с по-разному оформленными шифрами и разделами.

4. Генерация XLSX и запись в реестр MDR

После извлечения данных система:

  • формирует структурированные строки реестра;
  • генерирует итоговый XLSX-файл;
  • записывает данные в нужную Google-таблицу MDR;
  • учитывает, что в разных проектах заголовки колонок могут отличаться;
  • не тянет служебные поля из предыдущих строк, если они не были заданы явно.

В результате пользователь получает не просто разбор PDF, а сразу готовый операционный результат: обновленный реестр и выгруженный файл для дальнейшей работы.

5. Интеграция с проектным справочником и выбором проекта

Для корректной записи в MDR была реализована логика поиска проекта по справочнику:

  • бот ищет активные проекты в Google Sheets;
  • если проект найден однозначно, сценарий продолжается автоматически;
  • если найдено несколько вариантов, бот предлагает выбрать нужный;
  • после выбора система подставляет ссылку на нужный MDR и продолжает обработку без ручного копирования ссылок.

6. Подготовка к эксплуатации в serverless-контуре

Решение изначально адаптировалось под размещение в облачном serverless-окружении:

  • FastAPI-приложение работает как backend для Bitrix24 callback’ов;
  • состояние сценариев хранится в PostgreSQL;
  • итоговые файлы сохраняются в базе и отдаются по одноразовым ссылкам;
  • обработка адаптирована под Vercel-friendly режим;
  • архитектура не зависит от локального диска и подходит для разворачивания в управляемом облаке.

Технологии и инструменты

Архитектура

  • FastAPI / Starlette
  • SQLAlchemy
  • Celery

Интеграции

  • Bitrix24 REST API
  • Google Sheets API

Обработка документов

  • PyMuPDF
  • openpyxl

Инфраструктура

  • PostgreSQL
  • Vercel

Результаты

Разработан и внедрен внутренний чат-ассистент, который:

  • принимает PDF с замечаниями прямо в Bitrix24;
  • ведет пользователя по короткому сценарию уточнения данных;
  • извлекает замечания из PDF-аннотаций и метаданные из штампа;
  • автоматически формирует строки реестра;
  • записывает их в целевой MDR;
  • возвращает пользователю готовый XLSX с замечаниями;
  • поддерживает несколько PDF и несколько проектов в одном рабочем контуре;
  • учитывает неоднородность шаблонов Google-таблиц и реальных проектных документов.

Влияние на бизнес

  • Существенно снизилась доля ручной рутинной работы при переносе замечаний из PDF в реестр.
  • Снизился риск ошибок в ключевых полях: проект, шифр, раздел, автор замечания, лист, исполнитель.
  • Процесс стал предсказуемым и повторяемым: один и тот же сценарий теперь проходит по единым правилам.
  • Сотрудники работают в привычном канале общения, без отдельной системы и без переключения между несколькими интерфейсами.
  • У команды появилась основа для дальнейшей автоматизации смежных процессов: категоризация замечаний, обработка ответов на комментарии, расширение правил по структуре штампов и шаблонам MDR.

Отзыв и измеримый эффект

Один из главных практических результатов проекта заключался в том, что автоматизация позволила перевести процесс из состояния, где замечания фактически не попадали в базу, в состояние регулярного наполнения реестра.

Если формулировать это в прикладном виде для портфолио, отзыв можно подать так:

Благодаря чат-боту по извлечению замечаний из PDF в реестр команда смогла добавить в базу более 250 новых замечаний. Без автоматизации этот объем, скорее всего, остался бы необработанным, либо был бы отложен на неопределенный срок из-за высокой доли ручной работы.

Это важный эффект не только с точки зрения автоматизации, но и с точки зрения накопления данных: после внедрения инструмента у команды появился реальный структурированный массив замечаний, пригодный для последующего анализа и управленческих выводов.


Переход к следующему кейсу

Логическим продолжением этого проекта стал следующий этап автоматизации.

После того как удалось не просто собрать замечания, а системно накопить их в базе, появилась возможность перейти от операционного инструмента к аналитическому. На основе уже заполненного массива замечаний был разработан следующий AI-агент, который анализирует накопленные замечания, выявляет повторяющиеся паттерны и помогает формировать выученные уроки для команды.

Такой переход можно описывать в портфолио так:

Сначала мы автоматизировали извлечение и структурирование замечаний из PDF, создав устойчивый поток качественных данных. Затем, как логическое развитие решения, мы разработали отдельного агента для анализа уже накопленной базы замечаний. Это позволило без значительных затрат личного времени со стороны команды выявить X выученных уроков, провести корректирующие действия и заложить основу для повышения продуктивности на Y.

Если нужно, этот блок можно использовать как связку между кейсами:

  • кейс 1: автоматизация извлечения и накопления замечаний;
  • кейс 2: аналитический AI-агент для поиска закономерностей, выученных уроков и управленческих решений на основе уже собранной базы.

Что можно использовать в портфолио публично

Если кейс нужно публиковать в открытом виде, безопаснее всего оставлять следующие формулировки:

  • “внутренний Bitrix24-ассистент для проектной компании”;
  • “автоматизация обработки PDF-замечаний и записи в реестр MDR”;
  • “интеграция Bitrix24 + Google Sheets + PDF parsing + XLSX generation”;
  • “автоматизация рутинного документооборота в проектной среде”.

Не рекомендуется раскрывать:

  • название компании;
  • названия объектов и проектов;
  • ссылки на MDR-таблицы;
  • внутренние справочники проектов;
  • реальные примеры замечаний и проектной документации без согласования.

Связанные материалы

Документы

Как автоматизировать работу с документами без внедрения ERP

Разбираем, как автоматизировать работу с документами, замечаниями и реестрами без тяжёлого ERP-проекта и многомесячного внедрения.

Bitrix24

Как связать Bitrix24, Telegram и почту в один рабочий процесс

Разбираем, как убрать ручную склейку между Bitrix24, Telegram и почтой, чтобы заявки, статусы, документы и уведомления не терялись по дороге.

Автоматизация документов

Как автоматизировать обработку замечаний из PDF

Разбираем, как превратить ручную работу с PDF-замечаниями в понятный процесс с извлечением данных, записью в реестр и выдачей результата без бесконечного копирования.

Подходит под услуги

Автоматизация обработки PDF и замечаний

Автоматизируем разбор PDF, извлечение замечаний, запись в реестры и выдачу готового результата без ручного переноса.

Bitrix24-автоматизация

Связываем Bitrix24 с Telegram, почтой, документами и внутренними сервисами, чтобы процесс шёл без ручных дыр между системами.

Telegram-боты для компании

Делаем рабочих Telegram-ботов для внутренних заявок, статусов, документов и типовых действий сотрудников.

Напишите, какой процесс у вас сейчас тормозит работу

Можно коротко: “тонем в таблицах”, “нужен бот для команды”, “хотим убрать ручную обработку PDF”, “Bitrix24 не закрывает процесс”. Дальше уже разложим, с чего лучше начать.