Использование классического статистического подхода при проведении a/b тестов требует достаточно строгих условий эксперимента: знаний о показателе на старте, объеме выборки, невозможности подсматривания и расчете показателя p-value. Вся эта строгость необходима, чтобы однозначно сказать, существует отличие вариантов или нет (опровержение нулевой гипотезы).
Однако, не для всех гипотез имеется достаточный объем выборки, чтобы провести качественный эксперимент. А для тех, что есть, само тестирование может быть связано со значительными рисками, если вариант приводит к значительному ухудшению показателей, сказываясь на прибыли или репутации компании.
Альтернативным способом проведения a/b тестов, который решает эти проблемы, является байесовский подход. Он базируется на совершенно другой логике принятия решений, в которой ключевую роль играет не бинарный результат сравнения двух альтернатив, а распределение вероятностей того, что один вариант лучше другого (подробнее про математику
вы найдете вот здесь). Чем больше данных, тем это распределение “красноречивее” отвечает на вопрос, но чтобы сделать вывод, нет необходимости собирать “максимальное” количество знаний, как того требует статистический подход. Можно получить результаты раньше, хоть и с меньшим качеством.
Например, вот так байесовский подход использовала компания Garage 8 в своей работе:
Во время разработки флоу a/b тестирования рекламных креативов мы поставили перед собой цель: сократить длительность a/b тестов и, как следствие, рекламные бюджеты. В качестве альтернативы классическому (частотному) подходу, где требуется не только заранее рассчитать выборку, но и набрать ее для достижения статистической значимости, мы выбрали байесовский подход, который позволяет принять решение на основе меньшей выборки. Ключевая метрика здесь P2BB (Probability to be the best или Вероятность того, что креатив лучший). На выходе мы получаем распределение вероятностей. Например, вариация А лучшая с вероятностью 80%, вариация Б – с вероятность 20%. Мы используем отметку P2BB 75% для определения победителя. За 2023 мы провели более 150 a/b тестов на рекламной платформе. Благодаря использованию байесовского подхода большинство a/b тестов длились 4-7 дней. В одном из наших регионов за 2023 на рекламной платформе 53% конверсий принесли победители a/b тестов. На скриншоте приведен пример, когда статистическая значимость не достигнута, однако байесовский подход позволяет принять решение о победителе.