Антон Рудник Написать
01Результат 02Контекст 03Исследование 04Ограничения 05Проектирование 06Разработка 07Вклад

Голосовой AI‑агент по налогу на вклады

6 000 звонков в месяц. Оператор тратил на каждый 7 минут. AI‑агент справляется за 5 минут

ПериодQ3–Q4 2025
КаналIVR · Голосовой
РольProduct Designer (end‑to‑end)
КомандаАналитик · бэкендер · тестировщик · продакт
01 · Результат

Коротко о результате

4 FTE Освобождено ресурсов ~4,5 млн ₽/год экономии
−25% Среднее время обслуживания ~7 мин → ~5 мин
~70% Обращений закрыто агентом Остальное — эскалация или возврат
6 000 Звонков в месяц Масштаб тематики

Агент закрыл ~70% обращений без эскалации на оператора. Остальные 30% — негатив клиента (переход на оператора) или вопрос не по теме (возврат для переклассификации). Критерий запуска — 85%+ точности — был пройден на пилоте из ~300 диалогов.

02 · Контекст

Откуда появилась задача

В 2025 году в банке запустили стратегию агентизации контакт-центра — долгосрочный переход от консультаций людьми к виртуальному ассистенту на базе мультиагентной системы, неотличимому от человека.

Продуктовые команды запускают AI‑агентов в своих зонах ответственности. Каждый агент закрывает отдельную тематику и даёт измеримый эффект в FTE.

🎯

Задача: автоматизировать консультации по налогам на доходы по вкладам с помощью AI‑агента.

Цель: сократить FTE и снизить нагрузку на поддержку в пиковый налоговый период.

Почему налоги на вклады

С 2024 года доходы по вкладам облагаются налогом. Для клиентов это была новая ситуация — они не понимали, как всё устроено, и начинали звонить в поддержку.

Сначала я проверил с бизнесом, подходит ли тема для агента: консультации длинные (6–7 минут), вопросы типовые, логика легко формализуется. По теме — ~6 000 звонков в месяц с пиком осенью.

03 · Исследование

Звонки, боли, паттерны

Прослушал ~120 записей реальных звонков в поддержку. Выделил два типовых сценария: клиент сначала разбирается в общем — как работает налог, либо сразу уточняет персональные данные.

«Нужно ли платить налог со вклада?»
«Какая сумма не облагается налогом?»
«Хотел узнать размер дохода по вкладам для уплаты налога»
«Почему в ЛК ФНС вижу другую сумму?»

Где операторы теряли время

Персональные данные клиента находились в SmartCare, а справочная информация — в отдельной интерактивной схеме. На переключение уходило от 20 секунд до 2 минут в рамках одного звонка.

smartcare.sberbank.ru/tax-consult
Интерфейс SmartCare для налоговых консультаций

Интерфейс SmartCare, который операторы использовали для консультаций

Инсайт

Много времени уходило на поиск информации и переключение между источниками, а не на саму консультацию.

04 · Ограничения

Рамки и договорённости

Параллельно с исследованием звонков я общался с командой канала виртуального ассистента, чтобы понять технические рамки интеграции.

Сроки поджимали — выделить отдельный интент не успевали. Агент встроен в существующий интент и вызывается по ключевому слову «налог». Платформа накладывает жёсткое ограничение — до 7 секунд на ответ, после чего контекст сбрасывается.

7 секунд Лимит на ответ. После — контекст сбрасывается. Ограничение превратили в UX‑приём: фраза «Секундочку, уточню информацию» отправляется сразу. Клиент воспринимает паузу как естественную.

Договорённости с бизнесом

До проектирования архитектуры договорились, как агент должен вести себя в сложных ситуациях: при несогласии клиента с суммами — эскалация на оператора, при ошибочной тематике — возврат в IVR для переклассификации, для фиксации данных — SMS со ссылкой на справку о доходах.

05 · Проектирование

Архитектура агента

Неделя 1–2 Не сработало

Планировщик → Исполнитель → Критик

Один агент последовательно выполнял три роли. Терял контекст, формировал длинные ответы, не укладывался в лимит 7 секунд.

Неделя 3+ Финальное решение

Маршрутизатор + Критик + Определение периода

Один шаг — один источник. Быстро, предсказуемо, укладывается в ограничения. Бизнес обновляет RAG-базу самостоятельно.

Один шаг диалога — один источник данных

Маршрутизатор Определяет намерение → вызывает 1 из 6 функций → формирует ответ
Критик Валидирует: правильно ли понят вопрос, закрыта ли потребность
Определение периода Извлекает год из вопроса. Если не указан — прошлый год
📞
КлиентЗвонок на 900
вопрос
🧠
МаршрутизаторОпределяет намерение → вызывает 1 из 6 функций
1 из 6
📚RAGСправочная информация
🔊IVR-роликГолосовой ответ
🏦API банкаПерсональные данные
📱SMSСсылка на справку
👤ОператорЭскалация (негатив)
🔄IVR возвратПереклассификация
ответ
КритикПроверяет: вопрос понят? потребность закрыта? год корректен?
💬
Ответ клиентуЕстественная речь, до 7 секунд

Почему RAG, а не промпт

Изначально хотели хранить справочную информацию в промпте маршрутизатора. Но реальных вопросов оказалось слишком много — промпт раздувался и замедлял ответы.

Вынесли справочную базу в RAG: бизнес заполнял её в формате «вопрос — ответ». Стало быстрее и проще обновлять.

Как это звучит

AI-агент · Налоги на вклады
Голосовой канал 900
Нажмите «Запустить демо»
Было Оператор 2 системы, переключение на каждый вопрос. Средний звонок — 7 минут
Стало AI‑агент Звонок за 5 минут, 70% без эскалации. Минус 4 FTE
06 · Разработка

Разработка и запуск

Работал через Гигапромпт — внутренний конструктор банка. Писал промпт, тестировал на типичных фразах клиентов, бэкендер интегрировал в код, вместе с аналитиком валидировали и итерировали до 85%+ точности.

Фрагмент промпта маршрутизатора+

Роль: администратор на первой линии поддержки клиентов по вопросам налогов.

Ключевые правила: начислением налогов занимается ФНС, банк называет только сумму процентного дохода. В текущем году платим за прошлый.

Стиль: живая и естественная речь. Без «Сейчас подумаю» — клиенту важен ответ по сути.

Завершение: убедиться, что вопрос решён. Если да — добавить слово «КОНЕЦ».

Промпт определения периода+

Определить год, о котором идёт речь в вопросе клиента. Ответ — только год из четырёх цифр. Если год не указан → прошлый год.

Промпт критика+

Задача: проверить, что исполнитель правильно понял вопрос и полностью закрыл потребность.

Проверяется смысл ответа, а не точность формулировок.

Результат: если ответ соответствует вопросу → «success». Если нет → аргументы, почему.

Как добились 85%

Критерий запуска: не менее 85% успешных ответов. Успешный ответ — правильный выбор источника + корректный ответ по существу + правильное завершение диалога.

Оценивали вручную: прослушивал записи звонков с аналитиком, фиксировал ошибки, дорабатывал промпты.

Этапы тестирования и раскатки+

1. Внутреннее тестирование на типичных фразах клиентов

2. Пилот с командой и бизнесом → ~300 реальных звонков → 85%+

3. Постепенная раскатка: 10% → 20% → 30% → 100%

07 · Вклад

Мой вклад

Провёл исследование — прослушал ~120 звонков, работал с бизнесом и командой виртуального ассистента. Спроектировал архитектуру агента-маршрутизатора с валидацией через критика. Написал 3 промпта с ограничениями, правилами общения и стилем ответов. Провалидировал ~300 диалогов вручную, итерируя до 85%+ точности.

Ключевые решения

🧩
Один шаг — один источник Вместо избыточной трёхролевой логики — простой маршрутизатор
⏱️
7 сек → UX-приём «Секундочку» превращает ограничение платформы в естественную паузу
🛡️
Ограничения в промпте Чёткие правила и границы позволили избежать большинства ошибок

Тематика полностью закрыта агентом. За время запуска негативных реакций не зафиксировали — большинство клиентов не догадывалось, что разговаривает с AI.

📞

Позвоните на 900 и скажите «налог на вклады»

Вам ответит AI‑агент, которого я спроектировал