Как оценить по выборке генеральную совокупность? (Меры вариативности признака в генеральной совокупности)
Насколько сильно отклоняются от среднего те значения, которые на него не похожи.
Например две школы со средней оценкой 6. Но в одной все примерно одинаково учатся, а во второй есть много двоечников и много отличников. Явно нельзя сказать, что школы одинаковые используя только средние значения.

1. Размах
Расстояние между двумя крайними значениями.
Размах = (Max – Min)

2. Дисперсия
Дисперсия – мера разброса значений случайной величины (функции случайной величины) относительно её математического ожидания.
Учитывает каждый из объектов. Суммируем квадраты всех отклонений от среднего.
Из минусов, мы получаем большое отклонение от шкалы исследования из за квадрата.


‾X‾ – среднее значение выборки или генеральной совокупности.
Несмещенная дисперсия
Выборочная дисперсия – это оценка теоретической дисперсии распределения, рассчитанная на основе данных выборки относительно среднего значения в выборки.



На графиках видно, что даже на маленьких выборках несмещенная дисперсия сразу дает значения близкие к истинной дисперсии. Тогда как смещенная дает хорошие результаты только на больших выборках.

3. СКО – Среднеквадратичное отклонение
Чтобы уменьшить влияние возведения в квадрат значений в случае с дисперсией, придумали извлекать после корень из дисперсии. Тем самым снова возвращая значения в более коррелирующие со шкалой измерения.

Минусы: чувствительно к выбросам
4. AAD – среднее абсолютное отклонение
5. MAD – медианное абсолютное отклонение
Примеры с изменение средних и разбросов зарплат



6. Межквартильный размах
- Позволяет оценить разброс между типичными значениями
- менее чувствителен к выбросам
- позволяет оценить разброс на порядковых шкалах