Аналитика

Выбросы

Правила поиска необычных значений и устойчивые показатели для данных с выбросами.

5 формул

Таблица формул

Формула Запись Тема Для чего нужна
Медиана $Me=x_{(\frac{n+1}{2})}\quad\text{для нечетного }n$ Описательная статистика Медиана делит упорядоченный набор данных пополам: половина значений не больше медианы, а половина не меньше ее. Это устойчивая мера типичного значения.
Размах вариации $R=x_{max}-x_{min}$ Описательная статистика Размах вариации показывает расстояние между максимальным и минимальным значением набора данных. Это самый простой показатель разброса.
Квартили и межквартильный размах $IQR=Q_3-Q_1$ Описательная статистика Межквартильный размах показывает ширину средней половины данных: это разница между третьим и первым квартилем, устойчивее полного размаха.
Правило выбросов по IQR $x<Q_1-1.5\cdot IQR\quad\text{или}\quad x>Q_3+1.5\cdot IQR$ Описательная статистика Правило 1,5 IQR помечает значения как возможные выбросы, если они лежат ниже Q1−1,5·IQR или выше Q3+1,5·IQR, без предположения о нормальности.
Z-оценка $z=\frac{x-\bar{x}}{s}$ Описательная статистика Z-оценка показывает, на сколько стандартных отклонений наблюдение находится выше или ниже среднего значения, и помогает сравнивать разные шкалы.