Статистика
DomingoDecember 28, 2017Меры центральной тенденции
Мода - самое часто встречаемое значение
Медиана - значение равно удаленное от минимального и максимального
Среднее значение - сумма/количество
Выброс - показатели разительно отличающиеся от большинства
Усеченное (урезанное)среднее - среднее без выбросов (убрать 5%-10% с краев)
Меры изменчивости
Размах — разность между самым большим и самым маленьким котиком. Однако, как и среднее арифметическое, эта мера очень чувствительна к выбросам.
Межквартильный размах . Чтобы избежать искажений, мы должны отсечь 25% самых больших и 25% самых маленьких котиков и найти размах для оставшихся. Эта мера называется межквартильным размахом.
Дисперсия - Сумма модулей отклонений/Количество отклонений.
Однако, к большому сожалению, квадрат в этой формуле делает дисперсию очень неудобной для оценки разнообразия котиков: если мы измеряли размер в сантиметрах, то дисперсия имеет размерность в квадратных сантиметрах. Поэтому для удобства использования дисперсию берут под корень, получая по итогу показатель, называемый среднеквадратическим отклонением .
Стандартное отклонение - Корень из (Сумма модулей отклонений/Количество отклонений)
Отклонения - предположим, что мы решили сравнить размер некоторого конкретного котика (назовем его Барсиком) со средним котиковым размером. Разница (а точнее разность) этих размеров называется отклонением . И совершенно очевидно, что чем сильнее Барсик будет отличаться от среднего котика, тем больше будет это самое отклонение
Сумма отклонений будет равняться нулю. Часть данных будет больше стандартного значения, часть - меньше. Поэтому применяется модуль для вычисления дисперсии
Дисперсия и среднеквадратическое отклонение так же неустойчивы к выбросам, как и среднее арифметическое.
Нормальное распределение признака
Как правило, большинство (а именно около 68%) котиков находится в пределе одного среднеквадратического отклонения от среднего. Эти котики обладают так называемым нормальным размером. Оставшиеся 32% либо очень большие, либо очень маленькие.
Таким образом, зная всего два показателя, вы можете с достаточной долей уверенности сказать, как выглядит типичный котик, насколько разнообразными являются котики в целом и в каком диапазоне лежит норма по тому или иному признаку.