Аналитика

Описательная статистика

Среднее, медиана, дисперсия, стандартное отклонение и распределения.

Среднее арифметическое

Среднее арифметическое показывает типичный уровень числового показателя как сумму всех значений, деленную на количество наблюдений.

$\bar{x}=\frac{x_1+x_2+\dots+x_n}{n}$

Медиана

Медиана делит упорядоченный набор данных пополам: половина значений не больше медианы, а половина не меньше ее. Это устойчивая мера типичного значения.

$Me=x_{(\frac{n+1}{2})}\quad\text{для нечетного }n$

Мода

Мода — это значение, которое встречается в наборе данных чаще всего. Она полезна для категорий, популярных вариантов и повторяющихся числовых значений.

$Mo=\text{значение с максимальной частотой}$

Размах вариации

Размах вариации показывает расстояние между максимальным и минимальным значением набора данных. Это самый простой показатель разброса.

$R=x_{max}-x_{min}$

Выборочная дисперсия

Выборочная дисперсия измеряет средний квадрат отклонений значений от среднего с поправкой на n−1 для оценки разброса по выборке.

$s^2=\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n-1}$

Выборочное стандартное отклонение

Выборочное стандартное отклонение показывает типичный масштаб отклонения значений от среднего в исходных единицах показателя.

$s=\sqrt{\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n-1}}$

Квартили и межквартильный размах

Межквартильный размах показывает ширину средней половины данных: это разница между третьим и первым квартилем, устойчивее полного размаха.

$IQR=Q_3-Q_1$

Правило выбросов по IQR

Правило 1,5 IQR помечает значения как возможные выбросы, если они лежат ниже Q1−1,5·IQR или выше Q3+1,5·IQR, без предположения о нормальности.

$x<Q_1-1.5\cdot IQR\quad\text{или}\quad x>Q_3+1.5\cdot IQR$

Коэффициент вариации

Коэффициент вариации показывает относительный разброс: стандартное отклонение делят на среднее и выражают результат в процентах.

$CV=\frac{s}{\bar{x}}\cdot100\%$

Z-оценка

Z-оценка показывает, на сколько стандартных отклонений наблюдение находится выше или ниже среднего значения, и помогает сравнивать разные шкалы.

$z=\frac{x-\bar{x}}{s}$