Аналитика / A/B-тесты
Доверительный интервал разницы конверсий
Интервал показывает диапазон значимых значений разницы между группами на заданном уровне надежности.
Формула
Линия от нижней до верхней границы с отмеченной 0 и фактической точкой \Delta.
Наглядно видно, пересекает ли ноль нулевую гипотезу.
Обозначения
- $\hat p_A, \hat p_B$
- оценки конверсии в группах A и B, доля
- $SE_{\Delta}$
- SE разности двух долей, доля
- $z_{1-\alpha/2}$
- критическое значение нормального распределения для уровня \alpha, безразмерная
- $\alpha$
- уровень ошибки первого рода, доля
Условия применения
- Используйте нормальное приближение.
- Две группы определены без пересечений.
- Для 95% обычно берут α=0,05 и z_{0.975}=1.96.
Ограничения
- Для малых n может требоваться точный или бутстрэп-метод.
- Интервал может быть очень широким на редких событиях.
- Интервал описывает неопределенность оценки, а не индивидуальный результат пользователя.
Подробное объяснение
Расширяет точечный эффект на диапазон правдоподобных значений, учитывая разброс в выборках. Это основной элемент доверительного вывода в A/B.
Как пользоваться формулой
- Посчитайте \Delta и SE_{\Delta}.
- Выберите уровень надежности (например, 95%).
- Умножьте SE на соответствующий z.
- Постройте левую и правую границы.
Историческая справка
Концепция доверительных интервалов для пропорций — краеугольная идея классической статистической инференции.
Пример
Если \Delta=0,004, SE=0,0015 и 95%: z=1,96, тогда CI=(0,004-1,96·0,0015;\,0,004+1,96·0,0015)=(0,00106;0,00694).
Частая ошибка
Включать ноль в интервал и считать эффект полезным из бизнес-описания без статистической проверки.
Практика
Задачи с решением
Доверительный интервал
Условие. \Delta=0{,}004, SE=0{,}002, 90%-уровень (z=1{,}64).
Решение. CI=(0{,}004\pm1{,}64\cdot0{,}002)=(0{,}00072;0{,}00728).
Ответ. (0{,}00072;\,0{,}00728)
Интервал со знакомым значением
Условие. \Delta=-0{,}0015, SE=0{,}001, 95% (z=1{,}96).
Решение. CI=(-0{,}0015\pm1{,}96\cdot0{,}001)=(-0{,}00346;0{,}00046).
Ответ. (-0{,}00346;\,0{,}00046)
Дополнительные источники
- OpenIntro Statistics, confidence intervals for proportions
- NIST/SEMATECH e-Handbook of Statistical Methods, difference of proportions
Связанные формулы
Аналитика
Z-статистика для двух долей
Z-статистика показывает, насколько наблюдаемая разница конверсий удалена от нуля относительно дисперсии.
Аналитика
Мощность теста (power) для разности долей — концепт
Power отвечает на вопрос: с какой вероятностью тест обнаружит реальный эффект \Delta при заданном дизайне.
Аналитика
Минимальный размер выборки для двух долей (базовый)
Базовая оценка числа участников в каждой группе для обнаружения минимально значимого эффекта с заданными \alpha и power.
Аналитика
Доверительный интервал разницы конверсий
Интервал показывает диапазон значимых значений разницы между группами на заданном уровне надежности.