Внедрение RAG-системы в закрытом контуре
Собираем корпоративный контур «вопрос — ответ с цитатой из документа»: индексация, эмбеддинги, LLM и контроль прав — без выгрузки архива во внешние сервисы.
Какую задачу решает услуга
Сотрудники тратят часы на поиск в СЭД и сетевых папках; полнотекстовый поиск не понимает формулировку вопроса.
Чат с облачной LLM запрещён: документы нельзя отправлять наружу.
Разрозненные источники (1С, SAP, Directum, ELMA) без единого индекса и актуализации.
Нет контроля: модель может «галлюцинировать» без привязки к фрагментам корпуса.
Что входит в работы
- Инвентаризация источников и политик доступа к документам.
- Коннекторы к СЭД, 1С, SAP, файловым архивам по согласованному списку.
- Чанкинг, эмбеддинги, векторная БД on-premise.
- LLM-генератор ответов с обязательными ссылками на фрагменты.
- UI или API для целевых ролей (юристы, закупки, ИТ).
- Регламент обновления индекса и метрики качества на пилотном корпусе.
Что не входит в пилот
- — Полная замена корпоративной СЭД или ECM-системы.
- — OCR всего исторического архива без отдельной оценки объёма и сроков.
- — Автоматическое принятие юридических решений без участия эксперта.
Архитектура внедрения
Данные остаются в периметре: коннекторы забирают только разрешённые документы, индекс и LLM работают локально.
Коннекторы
Directum, 1С, SAP, ELMA, сетевые шары — с учётом ACL источника.
Индексация
Очистка, чанкинг, эмбеддинги; доля работ на реальных пилотах — до 30–40% бюджета.
Векторная БД
Postgres Pro + pgvector или специализированное хранилище on-premise.
LLM + RAG
Генерация ответа только по retrieved-фрагментам; настройка промптов.
Интерфейс / API
Веб-UI или встраивание в портал; SSO через AD.
Контроль доступа
Фильтрация результатов по правам пользователя на уровне индекса.
Версии СУБД и ОС (Astra Linux, РЕД ОС, Postgres Pro) уточняются на этапе проектирования под инфраструктуру заказчика.
Стоимость пилота
Срок: 4–8 недель на пилотный контур
- Проектные работы оптимального сценария: 3–6 млн ₽
- Индексация согласованного корпуса пилота
- Интеграция 3–5 источников по типовому перечню
- CAPEX на GPU при необходимости: 4–7 млн ₽ (оптимальный сценарий из разбора бюджета)
Итоговая стоимость уточняется после opening discovery и опросного листа. Объём архива для первичной индексации — ключевой фактор сметы.
Калькулятор бюджета пилота
Выберите параметры — получите ориентировочный диапазон бюджета на пилот и первый год эксплуатации. Расчёт по коридорам из статьи о стоимости LLM on-premise . Это не коммерческое предложение, а первая прикидка для внутреннего обсуждения.
Диапазон ориентировочный: курс рубля, доступность GPU, состав работ и требования регулятора двигают итоговую цифру. Для точного расчёта — обсуждение с архитектором AZONE-AI.
Частые вопросы
Чем RAG отличается от обычного поиска?
Семантический поиск находит фрагменты по смыслу запроса; LLM формулирует ответ с опорой на них. Это сокращает время на разбор регламентов и договоров при сохранении трассируемости.
Как часто обновляется индекс?
Регламент согласуется на пилоте: от ежедневной дельты до пакетной переиндексации. Без актуализации качество ответов падает.
Поддерживаете ли сканы и PDF?
Да, при наличии OCR-контура или готовых текстовых слоёв. Объём сканов влияет на сроки и стоимость индексации.
Можно ли ограничить ответы только внутренними документами?
Да. В пилоте настраиваем политику «только retrieved-фрагменты» и запрет ответа при низком score.
Связь с продуктом AzoneDoc?
AzoneDoc — готовое решение для документного RAG. Услуга внедрения RAG подходит, если нужна кастомная архитектура под несколько типов источников или нетиповой контур.
Сколько документов нужно для пилота?
Обычно от нескольких тысяч до десятков тысяч документов в одном домене (регламенты, договоры, ТЗ). Точный объём — на discovery.
Связанные материалы
Компоненты, потоки данных и типовые ошибки внедрения.
Практика семантического поиска в промышленном холдинге.
Статья «Данные и RAG» в структуре бюджета пилота.
Технический документ: Архитектура внедрения LLM в закрытом контуре КИИ
PDF ~20 страниц для CISO и архитекторов. Регуляторный контекст, эталонная архитектура, чек-лист готовности к пилоту.
Запросите расчёт пилота
Подготовим оценку сроков и бюджета по вашему контуру после опросного листа и opening discovery.