Category: Анализ данных (лекции)

Выборки в анализе данных

Зачем вообще нужна выборка? Иначе будет очень дорого опрашивать всех. Многие данные полностью просто не доступны. Какие бывают выборки? Простая случайная. Обычный рэндом. Механическая. Выбираем один случайный элемент и с определенным шагом начинаем выбирать элементы. Стратифицированная. Мы знаем что то про генеральную совокупность. Мы делим ее на страты и случайным образом выбираем из каждой страты. Например, мужчины и женщины. Гнездовая...

Как оценить по выборке генеральную совокупность? (Меры центральной тенденции)

Чтобы оценить по выборочным данным генеральную совокупность, нам нужно знать следующие вещи, чтобы описать распределение характеристики в генеральной совокупности объектов: 1. Где находятся типичные значения характеристики. => Меры среднего 2. То, насколько эти значения разрознены, насколько они не одинаковые => Меры разброса (вариативности) Как подсчитать меры среднего? 1. Среднее арифметическое Подходит для нормальных распределений, где нет выдающихся значений. 2. Рассчитать...

Типы данных в анализе данных и вычисление выборочной квантили

Номинальные – содержат меньше всего информации, принадлежность объектов к определенной группе. Мужчины, женщины; совы, жаворонки; Порядковые – тоже содержит принадлежность к группе, но кроме того определено и отношение порядка между значениями. Насколько вы счастливы по шкале от 1 до 9. Дискретные (интервальные) – и отношение к группе и порядок, но еще цифры означают сами себя и кроме порядка у нас...

Распределения случайных величин

Когда вы работаете со случайными величинами всегда нужно знать к какому распределению они принадлежат. Равномерное непрерывное распределение Экспоненциальное непрерывное распределение Экспоне́нта — показательная функция , где  — число Эйлера . Пример: Нормальные непрерывные распределения Коэффициент сдвига (μ) – то, насколько центр сдвинут по оси Х.   Значение случайной величины, которое распределено нормально находится в интервале от коэффициента сдвига ± три коэффициента масштаба. Логонормальные непрерывные распределения Для случайных величин,...

Основы теории вероятностей (терминология)

Терминология Случайный эксперимент – это любой эксперимент, результат которого не определяется начальными условиями. Пример: подбрасываение кубика. Элементарный исход (ω, “омега”) – это любой возможный исход случайного эксперимента. Пример: выпадение какой либо грани. Пространство элементарных исходов  (ω, “омега”) – множество всех возможных элементарных исходов эксперимента. Ω = {ω1,ω2,ω3,ω4,ω5,ω6}   Случайное событие – подмножество пространства элементарных исходов случайного эксперимента. Пример: в случае...