Контроль качества на потоке: как мы перешли от ручного прослушивания к AI-ассистенту

История трансформации QC-процесса в Medivey: от трех операторов с таблицами и 10% покрытия звонков до AI-системы, которая анализирует каждый перевод. Цифры, этапы и ошибки.

ЯС
Яна Смирнова
8 мин
Контроль качества на потоке: как мы перешли от ручного прослушивания к AI-ассистенту

Контроль качества колл-центра: узкое горлышко, которое не видно на дашборде

Когда Medivey обрабатывал 200-300 переводов в месяц, контроль качества звонков не был проблемой. Один опытный сотрудник выборочно слушал записи, ставил оценки в таблице, раз в неделю отправлял сводку руководителю. Всё работало.

Проблема проявилась при выходе на 1 500-2 000 переводов. Один человек физически не способен прослушать такой объем. Даже если каждый звонок длится 4 минуты, а на анализ уходит ещё 3, один QC-оператор обрабатывает 25-30 звонков за рабочий день. При 2 000 переводов в месяц это покрытие менее 10%.

Мы наняли ещё двух человек в QC. Покрытие выросло до 12-15%. Но вместе с численностью пришли новые задачи: синхронизация оценок, единый стандарт, распределение нагрузки. Три человека слушают один и тот же звонок — и выставляют три разных балла.

Как выглядел ручной контроль качества

Процесс был простым и понятным. Три QC-оператора каждый день получали выборку звонков: часть случайных, часть по триггерам (отказ застройщика, жалоба, короткий звонок). Каждый звонок слушали целиком, заполняли чек-лист из 12 пунктов, ставили итоговую оценку.

Что проверяли

  • Оператор представился и назвал компанию.
  • Уточнил цель обращения и тип недвижимости.
  • Спросил о бюджете и источнике средств.
  • Задал вопрос о сроках покупки.
  • Корректно обработал возражения.
  • Выполнил перевод по регламенту.

Где фиксировали

Результаты записывали в Google-таблицу. Раз в неделю руководитель группы сводил статистику: доля нарушений по пунктам, рейтинг операторов, динамика по неделям.

Система работала, пока объем позволял. Но три человека при полной загрузке покрывали 90-100 звонков в день. Остальные 70-80 звонков проходили без проверки. Мы контролировали качество выборки, а не потока.

Точка перелома: что ломается при росте

Первый тревожный сигнал — серия отклоненных переводов у одного застройщика за неделю. QC не поймал проблему, потому что звонки этого оператора не попали в выборку. Мы потеряли деньги и доверие клиента.

Второй сигнал — расхождение оценок. Мы провели калибровочную сессию: дали трем QC-операторам одни и те же 20 звонков. Совпадение оценок — 64%. Каждый третий звонок оценивался по-разному. Для оператора это означало, что его качество зависит не от работы, а от того, кто проверяет.

Третий сигнал — усталость. После четырех часов непрерывного прослушивания внимание падает. QC-оператор начинает слушать «по диагонали», пропускает нюансы, ставит оценки по инерции. Мы замеряли: точность оценок в первой половине дня была на 18% выше, чем после обеда.

Ручной QC при потоке свыше 1 000 переводов — это выбор: либо покрывать 10% и надеяться, что выборка репрезентативна, либо раздувать штат и решать проблему согласованности оценок.

Оба варианта нас не устраивали.

Покрытие QC: 10-15% вручную vs 100% с AI

Решение: строить самим или покупать

Мы изучили рынок. Готовых решений для автоматизации прослушки звонков в CPA-модели было мало. Платформы речевой аналитики заточены под классические колл-центры: входящая линия, фиксированный скрипт, стандартные KPI. Наша специфика другая.

Почему готовые решения не подошли

  • Мы работаем с десятками проектов одновременно. У каждого застройщика свои цены, планировки, регион, целевая аудитория. Генерическая модель не знает, что квартира за 8 млн в Краснодаре — это бизнес-класс, а в Москве — эконом.
  • Критерии качества меняются каждую неделю. Застройщик обновил прайс, закрыл корпус, запустил акцию — и скрипт оператора должен измениться. QC-система должна знать об этом в реальном времени.
  • Нам нужна не просто транскрипция, а контекстный анализ: совпадает ли бюджет клиента с ценами проекта, задал ли оператор все обязательные вопросы, соответствует ли источник лида типу проекта.

Мы решили строить систему внутри. Не потому что «можем», а потому что контекст проекта — наше конкурентное преимущество, и его нельзя передать внешнему сервису через API.

Три фазы внедрения

Мы не заменили людей машиной за один день. Переход занял четыре месяца и прошел через три фазы, каждая из которых снижала нагрузку на QC-команду и повышала покрытие.

Фаза 1. AI как второе мнение

На первом этапе AI-система работала параллельно с человеком. Каждый звонок, который слушал QC-оператор, одновременно анализировал AI. Результаты сравнивали.

Зачем это нужно: мы хотели измерить точность AI до того, как доверим ему самостоятельные решения. За первые 6 недель AI обработал около 800 звонков в параллели с ручным QC. Совпадение оценок — 87%. Расхождения мы разбирали по одному.

Типичные расхождения: AI строже оценивал пропуск вопроса о бюджете (человек иногда «прощал», если клиент сам назвал сумму косвенно). Человек лучше улавливал сарказм и двусмысленные ответы.

По итогам фазы мы скорректировали промпты и правила оценки. Совпадение выросло до 91%.

Фаза 2. AI на рутине, человек на сложных случаях

После калибровки мы разделили поток. AI стал основным аналитиком для звонков с однозначным результатом: явное нарушение (бюджет не совпадает, регион не тот, оператор не задал обязательные вопросы) или явное соответствие (все пункты чек-листа выполнены, клиент подтвердил интерес).

Звонки с неоднозначным результатом — пограничный бюджет, нестандартная ситуация, конфликтный диалог — уходили на ручную проверку.

Результат: QC-операторы стали тратить время на звонки, где действительно нужна экспертиза. Вместо 25-30 рутинных проверок в день — 10-12 сложных разборов. Качество их работы выросло, потому что исчезла монотонность.

Хотите такую же систему лидогенерации?

Покажем рабочий план запуска и контрольные метрики.

Фаза 3. AI как основной контролер

Сейчас AI анализирует каждый перевод. Система работает в двух режимах.

Автоматический режим — для случаев с высокой уверенностью. Если AI фиксирует явное нарушение (бюджет клиента ниже минимальной цены проекта на 30%+, клиент из нецелевого региона, оператор не задал ни одного квалификационного вопроса), отчет подтверждается автоматически.

Режим ревью — для пограничных случаев. AI формирует отчет со статусом «ожидает проверки», и человек принимает финальное решение. Это касается примерно 15-20% звонков.

Отличие от полной автоматизации: человек всегда в контуре. Мы не убрали QC-команду — мы изменили её функцию. Вместо прослушивания звонков они проверяют AI-отчеты, обучают систему на пограничных случаях и проводят калибровки.

Три фазы внедрения AI в контроль качества

Экономика: не про замену людей

Сравнение затрат при потоке 2 000 переводов в месяц.

Ручной QC:

  • 3 оператора, каждый обрабатывает 90-100 звонков в день.
  • Покрытие: 10-15% потока.
  • Фонд оплаты труда: три штатные единицы со всеми налогами и накладными.

AI + человек:

  • AI обрабатывает 100% потока.
  • 1 специалист проверяет пограничные случаи и калибрует систему.
  • Затраты на API: в десятки раз ниже стоимости ручной проверки одного звонка.
  • Покрытие: 100% потока.

Но главный эффект — не экономия, а покрытие. При ручном QC 85-90% звонков проходили без проверки. Любой из них мог содержать нарушение, которое стоит денег. Теперь проверяется каждый перевод.

Два оператора из трех перешли на другие задачи: один занимается обучением новых операторов на основе AI-отчетов, второй ведет калибровочные сессии с застройщиками.

Экономика: ручной QC vs AI + человек

Что AI ловит лучше человека — и наоборот

Преимущества AI

Знание контекста проекта. AI при анализе звонка «видит» актуальный прайс застройщика, параметры проекта, требования к квалификации. Если клиент говорит «у меня бюджет 6 миллионов», а минимальная цена в проекте — 9 миллионов, AI зафиксирует несоответствие. Человек-проверяющий может не помнить точные цены по всем двадцати проектам.

Отсутствие усталости. Пятисотый звонок за день AI анализирует с той же точностью, что и первый. У человека к концу смены точность падает.

Полный аудит. Каждое решение AI задокументировано: входные данные, логика оценки, результат. Если застройщик оспаривает отказ, мы можем показать, на основании чего было принято решение.

Преимущества человека

Эмоциональный контекст. AI хуже распознает ситуации, когда клиент формально отвечает правильно, но тон выдает отсутствие интереса. Или наоборот — клиент сомневается, но при грамотной работе оператора готов продолжить диалог.

Нестандартные ситуации. Клиент звонит по одному проекту, но в процессе разговора выясняется интерес к другому объекту того же застройщика. AI оценит звонок как несоответствие по параметрам, а опытный QC увидит возможность.

Обучение операторов. AI может указать на пропуск вопроса, но объяснить оператору, как лучше выстроить разговор в конкретной ситуации, — задача наставника.

Поэтому мы строим систему «AI + люди», где каждый закрывает свой класс задач.

Четыре урока внедрения AI в контроль качества колл-центра

Параллельный запуск обязателен. Если бы мы сразу переключили QC на AI, первые ошибки подорвали бы доверие команды. Шесть недель параллельной работы дали данные для калибровки и уверенность, что система работает.

Контекст важнее алгоритма. Точность AI зависит не от модели, а от входных данных. Когда мы добавили в контекст анализа актуальные цены проекта и источник лида, точность выросла на 8 процентных пунктов.

Процент ручной проверки снижается, но не до нуля. В первый месяц на ручную проверку уходило 40% звонков. Через три месяца — 20%. Сейчас — 15-18%. Мы не стремимся к нулю. Пограничные случаи — это источник данных для улучшения системы.

QC-команда не сокращается — она меняет роль. До AI три человека слушали звонки. После AI один человек проверяет отчеты, один обучает операторов, один ведет калибровки с клиентами. Объем работы тот же, но качество управления выше.

Результаты за полгода

  • Покрытие QC выросло с 10-15% до 100% потока.
  • Время от звонка до QC-отчета сократилось с 24-48 часов до минут.
  • Пропущенные нарушения: раньше мы узнавали о проблемах от застройщика, теперь фиксируем их до передачи.
  • Операторы получают обратную связь по каждому звонку, а не по случайной выборке. Это ускорило обучение новичков вдвое.
  • Застройщики стали получать детализированные отчеты по причинам отказов с разбивкой по каждому проекту.

Контроль качества на потоке — это не выбор между человеком и машиной. Это архитектура, в которой AI берет на себя объем, а человек — экспертизу.

AI-ассистент не решил все проблемы QC. Но он убрал главное ограничение — физический потолок ручной проверки. Теперь мы контролируем не выборку, а весь поток. И можем доказать это цифрами по каждому звонку.

Поделиться:
ЯС
Яна Смирнова

Руководитель клиентского сервиса. Отвечает за валидацию лидов и операционную эффективность.

Еще из блога

Читайте также

Как AI слушает 55 000 звонков: технология контроля качества Medivey

Как AI слушает 55 000 звонков: технология контроля качества Medivey

Разбираем по шагам, как устроен AI-пайплайн контроля качества звонков в Medivey: от записи разговора до отчета о нарушении в Telegram за 40 секунд. Транскрипция, обогащение контекстом, анализ, валидация и человеческий контроль.

КM
Команда Medivey
26 февраля 2026 г.9 мин
Кейс: как мы снизили стоимость целевого звонка на 40% в Краснодаре

Кейс: как мы снизили стоимость целевого звонка на 40% в Краснодаре

Разбираем, как выстроили CPA-канал для краснодарского застройщика с нуля: собрали региональную базу, разделили аудиторию на местных и релокантов, адаптировали скрипты и снизили CPL с 4 500 до 2 700 рублей.

КM
Команда Medivey
26 февраля 2026 г.6 мин
Конверсия 65% в целевой звонок: система контроля качества лидов на потоке

Конверсия 65% в целевой звонок: система контроля качества лидов на потоке

Как мы перестроили контроль качества переводов для крупного девелопера и подняли конверсию в целевой звонок с 35% до 65%. Четыре уровня фильтрации, AI-скоринг и еженедельная калибровка.

ЯС
Яна Смирнова
26 февраля 2026 г.7 мин