Архитектура системы Скорика
Scorika — это связка из SDK, серверной логики и ML-модели, которая позволяет бизнесу снижать стоимость заявки в Яндекс Директе через виртуальные конверсии, основанные на реальном поведении пользователей на сайте.
Общая схема работы
- Пользователь заходит на сайт
- SDK собирает поведение
- ML-модель считает score (вероятность покупки)
- Срабатывает виртуальная конверсия
- Сигнал уходит в Яндекс Метрику
- Яндекс Директ обучается на этих данных
Шаг 1. Сбор поведенческих данных через SDK
SDK Scorika превращает сайт в радар поведения. Мы фиксируем не просто клики и переходы, а полную картину вовлечённости — десятки поведенческих паттернов в реальном времени.
Что собирает SDK. Скрипт снимает более 600 параметров поведения:
- Какие страницы просматривает пользователь
- Какие кнопки попадают в поле зрения
- Клики, скроллы, время на странице
- Сколько товаров изучил
- Сколько раз возвращался к одной карточке
- Какой текст выделяет, куда наводит курсор
- Переходы между страницами каталога
- Цены товаров, которые рассматривает
- Взаимодействие с формами
- Попытки оформить заказ
Почему этого нет у самого Директа. Архитектурно Яндекс Директ не строит модель на сыром event-stream сайта. Он работает с pre-click сигналами (профиль пользователя в экосистеме Яндекса) и post-click агрегатами целей из Метрики.
Метрика и Директ связаны через слой целевых событий, а не через полный обмен поведенческими признаками. Директ учится на целях, e-commerce-событиях и доходе — но не на DOM-событиях, scroll depth, движениях мыши и других сырых сигналах. Поэтому качество автостратегии напрямую упирается в правильную настройку целей и передачу ценности. Scorika как раз закрывает этот разрыв: превращает полный поведенческий поток в дополнительные сигналы для обучения алгоритма.
Шаг 2. ML-модель предсказывает вероятность покупки
Мы используем тот же класс алгоритмов, что и сам Яндекс Директ (градиентный бустинг), но на стороне вашего сайта.
Модель анализирует собранные данные и выдаёт предсказание для каждого посетителя:
10%Игорь — вероятность покупки 50%Иван — вероятность покупки 80%Алексей — вероятность покупкиМодель кастомная: обучается под ваш конкретный сайт, ваш ассортимент, ценовой сегмент и поведение именно ваших покупателей. Универсального решения «для всех» здесь нет.
Шаг 3. Передача ценности в Яндекс Директ
Мы превращаем вероятность покупки в денежный сигнал через виртуальные цели.
Пример. Допустим, ваша средняя цена конверсии — 1 000 ₽:
- Посетитель с вероятностью 100% → цель 1 000 ₽
- Посетитель с вероятностью 50% → цель 500 ₽
- Посетитель с вероятностью 30% → цель 300 ₽
Сигнал идёт в Директ через Метрику:
JavaScriptym('reachGoal', 'scorika_goal', {value: 500})
Как настраивается оптимизация:
- Основная цель остаётся на оптимизацию за конверсию
- Виртуальная цель Scorika работает на оптимизацию за ДРР
- Задача Директа — находить пользователей с максимальным доходом
Вместо 100 конверсий в неделю у Директа теперь 300 — и он понимает, какие из них действительно ценные.
Шаг 4. Директ обучается лучше и быстрее
Автостратегия получает втрое больше качественных сигналов и начинает видеть закономерности.
Без Scorika
- 100 конверсий в неделю
- Все «не-покупатели» выглядят одинаково
- Директ не понимает, кто ближе к покупке
- Кампания упирается в плато
Со Scorika
- 300 конверсий в неделю
- Директ видит ценность каждого пользователя
- Понятно, кто на 80%, кто на 50%, кто на 10%
- Кампания выходит за пределы консервативной аудитории
Результат: снижение CPA на 20–30%
Наша задача — обучить Директ так, чтобы те же заявки стоили на 30% меньше.
За счёт чего это работает:
- Больше данных — вместо 10 конверсий в неделю Директ получает 50
- Ценность в рублях — алгоритм видит, что Игорь принесёт 300 ₽, а Иван — 800 ₽
- Оптимизация по ДРР — Директ ищет пользователей с максимальной отдачей
- Чёткие закономерности — алгоритм учится отличать «горячего» покупателя от случайного
Фильтрация спама и ботов
Качество автостратегии напрямую зависит от чистоты данных. Если в обучение попадают боты и спам-заявки, Директ начинает «оптимизироваться» под мусорный трафик. Scorika решает это на уровне ML-модели.
Как работает фильтрация:
- Модель обучена на типовых паттернах ботов и спам-заявок — они отличаются от живых людей по десяткам признаков: скорость заполнения форм, последовательность шагов, глубина вовлечения
- Если в вашей CRM есть разметка спама («нецелевой», «спам»), модель дополнительно учится на этих метках и точнее фильтрует мусор именно под ваш проект
- Боты могут имитировать отдельные действия, но при анализе полной сессии из 250+ параметров проявляются устойчивые паттерны, которые модель распознаёт
- Виртуальные конверсии не срабатывают для тех, кого модель квалифицировала как бота или спам — это защищает обучение Директа от загрязнения
На практике доля нецелевых заявок снижается, Директ концентрирует бюджет на реальных людях, и стоимость качественного лида падает.
Универсальность
Scorika работает с разными сайтами, ценовыми сегментами, товарами и сезонами:
- Кастомная модель — обучается под конкретный сайт, а не «средняя по больнице»
- Любая цена цели — от 500 ₽ до 500 000 ₽, логика работает одинаково
- Любой объём трафика — даже при 10 конверсиях в неделю мы доводим объём обучающих событий до 30–50
- Адаптация к сезонности — модель регулярно переобучается на свежих данных
Выход за пределы плато
Типичная проблема кампаний — упереться в плато. Набрали 100 конверсий, сфокусировались на узкой аудитории и застряли в ней.
Scorika подаёт в Директ данные о разной ценности пользователей — и алгоритм выходит за рамки консервативной аудитории, начинает искать новых покупателей.
Влияние на аукцион Яндекс Директа
Частый вопрос: «Не ломают ли виртуальные конверсии аукцион?» Короткий ответ — нет. Они в аукционе вообще не участвуют.
Как устроен аукцион. Рекламодатели конкурируют за показы по ставкам, CTR, качеству объявлений и релевантности. Этот механизм один для всех, и от того, какие цели у конкретного рекламодателя, он не зависит.
На что влияют виртуальные конверсии:
- Они меняют обучение автостратегии, но не ставки в аукционе напрямую
- Аукцион остаётся одинаковым для всех — Scorika не даёт преимущества на уровне торгов
- Что меняется: CatBoost-модель Директа получает расширенную выборку и быстрее находит закономерности
- Вместо 2–5 реальных конверсий в неделю автостратегия видит 20–50 событий (реальные + виртуальные)
- Скорость обучения растёт в 10–20 раз
- Алгоритм точнее сегментирует аудиторию по вероятности покупки
По сути Scorika не меняет правила игры — она даёт автостратегии больше качественных данных. Решения становятся точнее, но аукцион работает по тем же правилам.
Контролируемое срабатывание виртуальных целей
Виртуальная конверсия — это не случайный выстрел. Каждое срабатывание — результат анализа полной сессии пользователя.
Как принимается решение:
- SDK собирает поведенческие данные в реальном времени всю сессию
- Модель смотрит на полную картину: от первого клика до текущего момента
- Если вероятность конверсии превышает порог — отправляется виртуальная цель с динамической ценностью
Частота и ценность:
- Виртуальные цели срабатывают в 10–20 раз чаще реальных — это нормальная пропорция
- Типичная динамическая ценность одного события — 100–200 ₽ (зависит от установленной цены цели)
- Ценность для каждого посетителя считается индивидуально: Цена цели × Вероятность
- Суммарная ценность виртуальных событий стремится к паритету с суммарной ценностью реальных