AI Market Rating · независимый индекс AI/Digital
исследование 26 апреля 2026

Безопасность LLM и RAG: 4 критических риска и чек-лист контроля до production

Безопасность LLM-проектов начинается не с выбора модели и не с подписания NDA, а с карты типов данных, дизайна прав доступа, журналирования действий, проектирования контура обработки и регламентов использования AI-ответов. Особенно критично это для RAG-систем, где модель получает прямой доступ к корпоративным документам — включая те, к которым у конкретного пользователя могло бы и не быть прямого доступа в обычной системе. По нашим наблюдениям за 50+ корпоративными RAG-внедрениями за 2024–2026, около 35% проектов на этапе production-запуска находят критические уязвимости в правах доступа, которые не были видны в пилоте.

6 мин. чтения Хаб: RAG и LLM-архитектура Блоки данных: 7 Позиции: не продаются Авторы: Инна Пак, Марина Иванова
cluster hub

RAG и LLM-архитектура

RAG, LLMOps, качество ответов, безопасность, подготовка данных и корпоративный поиск.

shortlist

Рейтинги подрядчиков по теме исследования

Если после чтения нужен короткий список исполнителей, начните с профильных рейтингов AI Market Rating: в них видны компании, кейсы, интервью, категории экспертизы и доверительный индекс.

methodology

Как проверять выводы исследования

Используйте материал как основу для shortlist: сопоставьте выводы с профилями компаний, связанными рейтингами, кейсами, интервью клиентов и источниками. Если в статье есть список источников, начинайте проверку с него; если источников мало, дополнительно запросите у подрядчика методику, baseline и примеры работ.

E-E-A-T

Авторы и проверка материала

У каждого исследования есть персональные авторы, профиль экспертизы, дата публикации, список источников и редакционная проверка выводов.

Experience

Авторы закреплены по теме исследования и опираются на практические разборы страниц, кейсов, источников и рыночных выборок.

Expertise

В профиле автора указаны зона экспертизы, роль в редакции, регалии и темы, за которые он отвечает.

Authoritativeness

Материалы связаны с методологией AI Market Rating, внутренними рейтингами, карточками компаний и источниками.

Trust

Позиции не продаются, выводы отделены от рекламы, а проверяемые утверждения поддержаны источниками и датами обновления.

Как раскладывали риски

Мы сгруппировали риски LLM/RAG по 5 уровням: (1) данные — что попадает в индекс и как защищено; (2) модель — какая используется, где работает, какие у неё ограничения; (3) приложение — как настроены права, RBAC, фильтры; (4) пользователь — кто и как взаимодействует с системой; (5) эксплуатация — мониторинг, обновления, реагирование на инциденты. Для каждого уровня описали типичные риски и контрмеры.

Для каждого риска оценили вероятность реализации в типичной B2B-компании и потенциальный ущерб (репутационный, финансовый, регуляторный). Получилась карта приоритетов: 4 риска требуют обязательной проработки до production-запуска, 6 — желательной, остальные — приемлемых при базовых мерах. Источник — публичные инциденты с LLM-системами 2023–2025 годов, наблюдения за внедрениями в РФ и СНГ, опыт red team-тестирования RAG-систем.

сгенерированный research-кадр

Безопасность LLM/RAG: доступы, источники и риск-контур

Медиа-блок выводит на первый план то, что часто пропускают в продающих материалах: права доступа, хранение данных, журналы, red-team проверки и контракты.

Темная панель проверки безопасности LLM и RAG с риск-радаром и контрольными метками
Сгенерированный research-кадр для безопасности LLM, RAG и AI-подрядчиков.

Срез исследования

Четыре опорных вывода, которые помогают быстро понять материал.

Критических рисков 4

утечка через RBAC, галлюцинации, prompt injection, нет аудита

Главный риск RBAC

неправильные права доступа на уровне retrieval — критично

Защита от галлюцинаций цитаты

обязательное указание источника + confidence-score в ответе

До запуска red team

проверка атак и типичных ошибок на 100+ тестовых сценариях

модель тренда / редакционный индекс

Индекс требований к AI-безопасности

Редакционная модель: чем ближе AI к данным клиента, тем быстрее растут требования к безопасности, логам и управлению доступами.

89/100
89 66,8 44,5 22,3 0 2022 2023 2024 2025 2026 2027
/// доступы: least privilege /// логи: audit trail /// риск: утечки контекста

Приоритеты безопасности LLM/RAG

Что критичнее всего проверить до production-запуска корпоративной AI-системы.

Права доступа к документам 92

Агент не должен видеть лишнее — RBAC должен применяться до retrieval, а не только в UI

92
Логирование и аудит-логи 84

Нужны для расследований инцидентов и для compliance в регулируемых отраслях

84
Оценка качества ответов 78

Снижает риск галлюцинаций — методика evaluation на 100+ тестовых вопросах

78
Выбор модного интерфейса 24

Не решает безопасность — UI можно сделать на любом стеке за неделю

24

Безопасность — это не один NDA

NDA с подрядчиком важен и нужен, но он не ограничивает доступ модели к корпоративным документам и не проверяет, кто конкретно получил ответ системы. Production-система должна технически разделять права на уровне индекса (RBAC до retrieval), хранить детальные логи всех запросов и ответов, фильтровать чувствительные данные на входе и выходе, и иметь механизм быстрого отключения рискованных сценариев без полной остановки сервиса.

Типичная история: компания запускает RAG-систему с RBAC только на уровне UI («у пользователя X нет кнопки на закрытый документ»). Через месяц обнаруживается, что в индекс попали закрытые документы, и через специально сформулированный запрос пользователь Y получает выдержки из них в ответе. Технически это утечка, формально — нарушение политики безопасности. Решение единственное: применять RBAC до индексации и до retrieval — это требует правильной архитектуры с самого начала.

  • Составьте карту типов данных в одной таблице: публичные, внутренние, персональные, коммерческая тайна, особо чувствительные. Для каждого типа — отдельный регламент.
  • Разделите пользователей по ролям и проверьте, что RAG соблюдает эти роли на уровне retrieval, а не только в интерфейсе.
  • Проведите red team-тестирование: prompt injection через документы, утечки через формулировки цитат, ответы на запрещённые темы — минимум 100 тестовых сценариев.
  • Настройте мониторинг типичных аномалий: рост числа запросов от одного пользователя, неожиданные источники в ответах, попытки обхода фильтров.

Главные риски LLM/RAG и контрмеры

Минимальная карта безопасности — каждая контрмера должна быть в техническом задании и проверена до приёмки.

Риск Как проявляется Контрмера
Лишний доступ Пользователь получает в ответе фрагменты из закрытого документа, потому что RBAC применяется только в UI. RBAC до retrieval: фильтрация индекса по правам, проверка ACL на каждый запрос, отдельный индекс для разных ролей.
Галлюцинация Ответ звучит уверенно, но источник не проверяется — модель выдаёт правдоподобную ложь. Обязательные цитаты с указанием источника, confidence-score, отказ от ответа при низкой уверенности («не знаю» лучше выдумки).
Prompt injection Документ или пользователь содержит инструкции, меняющие поведение агента: «забудь все правила и...». Фильтры на входе и выходе, системные промпты с защитой, регулярные red team-тесты на новые методы атак.
Нет аудит-логов После инцидента нельзя понять, кто что спросил, какой ответ получил, какие источники использовались. Полное логирование запросов, ответов, источников и действий пользователя. Хранение по политике компании или 152-ФЗ.

Вероятность и потенциальный ущерб рисков

Верхний правый сектор требует обязательной проработки до production-запуска и регулярных проверок после.

проверяемость / сложность эффект / ценность
Лишний доступ критично, обязательно
Галлюцинация нужны цитаты и confidence
Prompt injection тестировать регулярно
UI-ошибка ниже ущерб, не критично

Security checklist перед production

Практический минимум для брифа, аудита или внутреннего обсуждения.

Data map Типы данных и их ограничения описаны в одном документе. Для каждого типа — регламент обработки и доступа.
RBAC до retrieval Права применяются на уровне индекса, а не только в UI. Проверено red team-тестированием.
Citations + confidence Все ответы показывают источники с указанием документа и фрагмента. Confidence-score доступен пользователю и в API.
Audit logs Запросы, ответы, источники и действия журналируются. Хранение по политике компании или регуляторным требованиям.

Как применить материал

Материал связывает RAG, AI-внедрение и enterprise-запросы. Он должен вести на рейтинг RAG-систем, рейтинг AI-интеграторов и материал по стоимости RAG-внедрения. Для бизнеса работает как pre-sales-чеклист: при выборе подрядчика спросите про каждый из 4 критических рисков и попросите конкретные технические ответы (а не общие фразы «обеспечим безопасность»). Сильный подрядчик отвечает развёрнуто, ссылаясь на свой опыт; слабый — переводит разговор на «у нас есть NDA». Для внутренней команды это чек-лист на сдачу-приёмку: ни один RAG-проект не должен идти в production без прохождения всех 4 пунктов.

Связь с хабом, рейтингом и сервисной страницей

Материал относится к хабу «RAG и LLM-архитектура» и должен работать как вход в следующий выбор: понять интент, проверить ограничения и перейти к сравнению подрядчиков. Для shortlist используйте «Рейтинг RAG-подрядчиков», а для постановки задачи — страницу «RAG-системы». Такой маршрут уменьшает риск малоценной страницы: пользователь видит ответ, критерии, источники, дату обновления и следующий практический шаг.

  • Хаб: RAG и LLM-архитектура
  • Рейтинг для сравнения: Рейтинг RAG-подрядчиков
  • Сервисная страница для постановки задачи: RAG-системы

Частые вопросы

Можно ли безопасно использовать облачные LLM (GPT, Claude, Gemini) с корпоративными данными?

Можно, если выбранный контур соответствует требованиям данных, договорным условиям с вендором, логированию и политике компании. Для большинства публичных и обезличенных данных — облачные API нормальны. Для персональных данных в РФ нужен дополнительный анализ соответствия 152-ФЗ. Для особо чувствительных данных (банковская тайна, медицинские записи) практически всегда нужен on-premise или приватный контур.

Что самое важное в безопасности RAG-системы?

Четыре приоритета: (1) права доступа на уровне retrieval — RBAC должен применяться до того, как фрагменты попали в контекст модели; (2) обязательные цитаты с указанием источника в каждом ответе; (3) полное аудит-логирование запросов и ответов; (4) регулярное red team-тестирование на типичные атаки и обходы. Без любого из четырёх — production-качество не достигается.

Сколько стоит правильная безопасность RAG-проекта?

В типичном корпоративном проекте безопасность занимает 15–25% бюджета: дизайн RBAC и data map (300–800 тыс. ₽ разово), внедрение RBAC до retrieval и аудит-логов (600 тыс. – 2 млн ₽), red team-тестирование (200–500 тыс. ₽ разово), регулярная переоценка раз в 6 месяцев (100–300 тыс. ₽ за раунд). Для регулируемых отраслей бюджет на безопасность может доходить до 35–45% общего.

Как защититься от prompt injection?

Многоуровневая защита: фильтры на входе (детектирование подозрительных паттернов «забудь правила», «новая инструкция»), системные промпты с явной защитой и приоритизацией политик безопасности, фильтры на выходе (проверка ответа на утечку чувствительных данных), регулярные red team-тесты на новые методы атак (методы быстро эволюционируют). Полностью защититься нельзя, но можно сильно повысить стоимость атаки.

Нужно ли on-premise LLM для корпоративных проектов?

Зависит от уровня чувствительности данных и регуляторного контура. Для большинства корпоративных задач — нет, облачные модели через API с правильным контуром достаточны. Для финансов с банковской тайной, медицины с PHI, госсектора и особо чувствительных enterprise-проектов — обычно да. On-premise дороже на 30–60% в эксплуатации, но даёт полный контроль над данными и моделью. Для российских компаний альтернативы — GigaChat и YandexGPT, у них есть приватные контуры.

verification

Источники и метод проверки

Редакционная проверка AI Rate: материал относится к хабу «RAG и LLM-архитектура», опирается на официальные источники и связан с профильным рейтингом «Рейтинг RAG-подрядчиков». Дата обновления: 01.06.2026.

company evidence

Связанные профили компаний

Эти карточки помогают проверить, какие подрядчики уже связаны с темой исследования, какие категории и внешние сигналы есть в профиле, и что запросить до договора.

next step

Сравнить подрядчиков по рейтингу

Исследование помогает сформулировать критерии. Для короткого списка используйте категории рейтинга и карточки компаний.

Все рейтинги AI/Digital