AI Market Rating · независимый индекс AI/Digital
исследование 7 мая 2026

Сколько стоит внедрение RAG в 2026: разбор бюджета по 8 этапам

Стоимость RAG-системы складывается из 8 этапов lifecycle: discovery, data preparation, retrieval, generation, security, integrations, evaluation, operations. По нашим наблюдениям за 30+ корпоративными RAG-проектами в РФ и СНГ за 2024–2026 годы, около 60% бюджета уходит на работы, которые не видит пользователь — подготовку данных, права доступа и оценку качества. Поэтому сравнивать только цену «чат-бота по документам» опасно: одно и то же предложение в 2 млн ₽ может быть и пилотом за 2 месяца, и черновиком production за полгода — разница в качестве в 5–10 раз.

6 мин. чтения Хаб: RAG и LLM-архитектура Блоки данных: 7 Позиции: не продаются Авторы: Марина Иванова
cluster hub

RAG и LLM-архитектура

RAG, LLMOps, качество ответов, безопасность, подготовка данных и корпоративный поиск.

shortlist

Рейтинги подрядчиков по теме исследования

Если после чтения нужен короткий список исполнителей, начните с профильных рейтингов AI Market Rating: в них видны компании, кейсы, интервью, категории экспертизы и доверительный индекс.

methodology

Как проверять выводы исследования

Используйте материал как основу для shortlist: сопоставьте выводы с профилями компаний, связанными рейтингами, кейсами, интервью клиентов и источниками. Если в статье есть список источников, начинайте проверку с него; если источников мало, дополнительно запросите у подрядчика методику, baseline и примеры работ.

E-E-A-T

Авторы и проверка материала

У каждого исследования есть персональные авторы, профиль экспертизы, дата публикации, список источников и редакционная проверка выводов.

Experience

Авторы закреплены по теме исследования и опираются на практические разборы страниц, кейсов, источников и рыночных выборок.

Expertise

В профиле автора указаны зона экспертизы, роль в редакции, регалии и темы, за которые он отвечает.

Authoritativeness

Материалы связаны с методологией AI Market Rating, внутренними рейтингами, карточками компаний и источниками.

Trust

Позиции не продаются, выводы отделены от рекламы, а проверяемые утверждения поддержаны источниками и датами обновления.

Как раскладывали бюджет

Мы разложили типичный RAG-проект на 8 этапов lifecycle: (1) discovery — сценарии, пользователи, KPI; (2) data preparation — чистка, разметка, chunking; (3) retrieval — поисковая часть, ranking; (4) generation — LLM-слой, prompt engineering; (5) security — RBAC, аудит, шифрование; (6) integrations — CRM, DMS, AD, чаты; (7) evaluation — тестовые вопросы, эталоны, приёмка; (8) operations — обновление индекса, мониторинг, поддержка.

Для каждого этапа собрали диапазон трудозатрат и цен по 30+ проектам — собственные наблюдения, открытые публикации и общение с командами интеграторов. Цены — не прайс конкретного агентства, а ориентир для оценки коммерческих предложений. Главная цель — показать структуру бюджета, чтобы заказчик мог проверить, какой пункт у его подрядчика «проседает» или вообще отсутствует.

сгенерированный research-кадр

RAG-контур: база знаний, источники и проверка ответа

Медиа-блок помогает быстро считать контекст: документы, векторный поиск, ссылки на источники и контроль качества ответа работают как одна система.

Темная рабочая станция с графом знаний, документами и RAG-дашбордами
Сгенерированный research-кадр для RAG и корпоративных баз знаний.

Срез исследования

Четыре опорных вывода, которые помогают быстро понять материал.

Этапов в lifecycle 8

от discovery до эксплуатации

Невидимый бюджет ~60%

data prep, RBAC, evaluation — то, что не видит пользователь в демо

Цена пилота 0,5–1,5 млн ₽

50–200 документов, 30+ тестовых вопросов, 1,5–3 месяца

Цена production 3–10 млн ₽

6–9 месяцев с RBAC, интеграциями и evaluation

модель тренда / редакционный индекс

Индекс зрелости RAG-внедрений

Редакционная модель: как растет практическая готовность компаний платить за управляемые базы знаний и проверяемые ответы.

86/100
86 64,5 43 21,5 0 2022 2023 2024 2025 2026 2027
/// данные: качество источников /// контроль: citations /// риск: устаревшие документы

Структура трудоёмкости RAG-проекта

Не прайс конкретного подрядчика, а ориентир по доле внимания и часов в типичном проекте.

Подготовка данных 86

Чаще дороже разработки интерфейса — особенно при сканах, PDF и таблицах

86
Интеграции и доступы 78

Зависят от IT-ландшафта: AD, CRM, DMS, мессенджеры — каждая своя сложность

78
Оценка качества (evaluation) 68

Нужна до production — без неё нельзя принять систему у подрядчика

68
UI чата 42

Заметен пользователю, но не главный риск — типовая часть, давно отработана

42

Почему пилот дешевле, чем ошибка в production

RAG выглядит обманчиво простым, пока работает на 20 эталонных документах. На реальной базе из 50 тысяч файлов появляются дубли, устаревшие версии, закрытые документы, длинные таблицы, сканы плохого качества, разные языки в одном файле и взаимно конфликтующие источники. Хороший пилот должен не впечатлить демо, а обнаружить эти проблемы до промышленного запуска.

Типичная история: компания берёт подрядчика на «быстрый пилот» за 600к ₽ за месяц — получает работающее демо. Дальше согласовывает production за 4 млн ₽. На production открывается реальная база — и оказывается, что 30% документов — это PDF-сканы, права доступа сложнее, чем думали, а 15 источников в проде дают конфликтующие ответы. Бюджет вырастает до 7–8 млн ₽, срок — на 3–4 месяца. Этих расходов не было бы, если бы пилот сразу включал реальные документы и evaluation.

  • Фиксируйте в договоре, какие источники входят в первый релиз, а какие остаются за рамками — это снимает 80% споров о бюджете.
  • Согласуйте метрику качества ответа (accuracy, relevance, citation correctness) до выбора модели — иначе оценивать нечего.
  • Заложите поддержку с первого дня: документы меняются, индекс нужно обновлять, evaluation — повторять каждые 3–6 месяцев.
  • Просите выделить data preparation отдельной строкой — это единственный способ контролировать самый дорогой этап.

Что должно быть в смете RAG-проекта

Если какого-то пункта нет в коммерческом предложении — его стоит обсудить отдельно или попросить включить.

Блок Что входит Риск без блока
Discovery Сценарии использования, пользователи, права доступа, источники, KPI и метрики приёмки. Разработка идёт «в стол» и не решает реальную бизнес-задачу.
Data preparation Очистка, разметка, версионирование, поддержка форматов (PDF, DOCX, сканы), chunking. Ответы будут неточными, устаревшими или галлюцинировать на пробелах в данных.
Evaluation Тестовые вопросы, эталонные ответы, методика приёмки, отчёт о качестве в %. Нельзя доказать качество — приёмка превращается в «вроде работает».
Operations Обновление индекса, логирование, мониторинг доступности, поддержка после релиза. Система деградирует за 3–6 месяцев после запуска без видимых причин.

Где чаще растёт бюджет

Верхний правый сектор требует отдельного резерва бюджета (15–25%) и назначенного владельца со стороны клиента.

проверяемость / сложность эффект / ценность
Права доступа (RBAC) почти всегда недооценены
Сканы и PDF нужна OCR + ручная проверка
UI понятный объём, без сюрпризов
Evaluation нужна методика и эталоны

Как сравнить предложения подрядчиков

Практический минимум для брифа, аудита или внутреннего обсуждения.

Есть discovery Подрядчик не начинает с разработки интерфейса. Discovery занимает 2–4 недели и стоит 200–500 тыс. ₽.
Есть evaluation Качество ответа проверяется на наборе из 50–100 вопросов с эталонными ответами. Метрики — accuracy, relevance, citation correctness.
Описана безопасность В смете отдельной строкой: RBAC до retrieval, аудит-логи, шифрование, контур данных (cloud / on-prem).
Согласована поддержка Понятно, кто и за сколько обновляет индекс, обрабатывает фидбек и переобучает фильтры после релиза.

Как применить выводы

Статья закрывает коммерческий long-tail «стоимость RAG-системы» и должна вести на рейтинг RAG-подрядчиков и материал про безопасность LLM/RAG. Для бизнеса главный вывод: не выбирать RAG-подрядчика по итоговой цене — сравнивать состав работ по 8 этапам lifecycle. Если подрядчик предлагает «production за 1,5 млн ₽» без discovery, evaluation и поддержки — это или пилот, или будущий перерасход в 2–3 раза. Реалистичный путь для большинства корпоративных проектов: discovery (200–500к ₽) → пилот на 50–200 документах (500к–1,5 млн ₽) → production (3–10 млн ₽) → поддержка (150–500к ₽/мес).

Связь с хабом, рейтингом и сервисной страницей

Материал относится к хабу «RAG и LLM-архитектура» и должен работать как вход в следующий выбор: понять интент, проверить ограничения и перейти к сравнению подрядчиков. Для shortlist используйте «Рейтинг RAG-подрядчиков», а для постановки задачи — страницу «RAG-системы». Такой маршрут уменьшает риск малоценной страницы: пользователь видит ответ, критерии, источники, дату обновления и следующий практический шаг.

  • Хаб: RAG и LLM-архитектура
  • Рейтинг для сравнения: Рейтинг RAG-подрядчиков
  • Сервисная страница для постановки задачи: RAG-системы

Частые вопросы

Можно ли сделать RAG быстро?

Демо или пилот — да, за 3–6 недель и 500–800 тыс. ₽. Для этого ограничивают источники (50–100 документов), сценарии (1–2 типа вопросов) и не настраивают сложный RBAC. Production такого срока не выдерживает: подготовка данных, интеграции и evaluation требуют минимум 4–6 месяцев.

Что дороже в RAG-проекте: модель или интеграции?

В большинстве корпоративных проектов интеграции, права доступа и подготовка данных дороже, чем сама LLM-инференс-часть. Стоимость API GPT-4 или GigaChat-Pro на корпоративном объёме обычно укладывается в 30–80 тыс. ₽/мес. А вот настройка интеграции с AD и DMS может стоить 600 тыс. – 1,5 млн ₽ разово.

Сколько стоит поддержка RAG-системы?

Минимальный пакет — 150–250 тыс. ₽/мес: обновление индекса раз в 1–2 недели, базовый мониторинг, обработка инцидентов. Расширенный (с регулярной evaluation и улучшениями ответов) — 300–500 тыс. ₽/мес. Для крупного enterprise с несколькими RAG-системами — от 600 тыс. ₽/мес. Без поддержки система деградирует за 3–6 месяцев.

Можно ли сэкономить, использовав готовое RAG-решение?

Можно, если задача типовая (FAQ-бот, поиск по статьям, чат для поддержки) и нет жёстких требований к данным. Готовые SaaS-решения (типа Chatbase, CustomGPT) стоят 5–25 тыс. ₽/мес и запускаются за неделю. Но они почти всегда не подходят для enterprise: нет RBAC до retrieval, ограниченные интеграции, данные уходят в облако вендора.

Какой ROI у RAG-проектов в среднем?

Зависит от сценария. В поддержке — окупаемость обычно 6–12 месяцев за счёт снижения AHT и числа эскалаций (один оператор обрабатывает в 1,5–2 раза больше обращений). В продажах — 8–14 месяцев через ускорение подготовки КП. В compliance и enterprise knowledge base ROI считается через экономию времени высокооплачиваемых специалистов — 12–18 месяцев.

verification

Источники и метод проверки

Редакционная проверка AI Rate: материал относится к хабу «RAG и LLM-архитектура», опирается на официальные источники и связан с профильным рейтингом «Рейтинг RAG-подрядчиков». Дата обновления: 01.06.2026.

company evidence

Связанные профили компаний

Эти карточки помогают проверить, какие подрядчики уже связаны с темой исследования, какие категории и внешние сигналы есть в профиле, и что запросить до договора.

next step

Сравнить подрядчиков по рейтингу

Исследование помогает сформулировать критерии. Для короткого списка используйте категории рейтинга и карточки компаний.

Рейтинг RAG-подрядчиков