Статистика

Статистика

DomingoDecember 28, 2017

Меры центральной тенденции

Мода - самое часто встречаемое значение


Медиана - значение равно удаленное от минимального и максимального


Среднее значение - сумма/количество


Выброс - показатели разительно отличающиеся от большинства


Усеченное (урезанное)среднее - среднее без выбросов (убрать 5%-10% с краев)

Меры изменчивости

Размах — разность между самым большим и самым маленьким котиком. Однако, как и среднее арифметическое, эта мера очень чувствительна к выбросам.

Межквартильный размах . Чтобы избежать искажений, мы должны отсечь 25% самых больших и 25% самых маленьких котиков и найти размах для оставшихся. Эта мера называется межквартильным размахом.


Дисперсия - Сумма модулей отклонений/Количество отклонений.


Однако, к большому сожалению, квадрат в этой формуле делает дисперсию очень неудобной для оценки разнообразия котиков: если мы измеряли размер в сантиметрах, то дисперсия имеет размерность в квадратных сантиметрах. Поэтому для удобства использования дисперсию берут под корень, получая по итогу показатель, называемый  среднеквадратическим отклонением .

Стандартное отклонение - Корень из (Сумма модулей отклонений/Количество отклонений)

Отклонения - предположим, что мы решили сравнить размер некоторого конкретного котика (назовем его Барсиком) со средним котиковым размером. Разница (а точнее разность) этих размеров называется  отклонением . И совершенно очевидно, что чем сильнее Барсик будет отличаться от среднего котика, тем больше будет это самое отклонение

Сумма отклонений будет равняться нулю. Часть данных будет больше стандартного значения, часть - меньше. Поэтому применяется модуль для вычисления дисперсии


Дисперсия и среднеквадратическое отклонение так же неустойчивы к выбросам, как и среднее арифметическое.

Нормальное распределение признака

Как правило, большинство (а именно около 68%) котиков находится в пределе одного среднеквадратического отклонения от среднего. Эти котики обладают так называемым  нормальным размером. Оставшиеся 32% либо очень большие, либо очень маленькие.

Среднее значение - X. Среднеквадратичное отклонение -S

Таким образом, зная всего два показателя, вы можете с достаточной долей уверенности сказать, как выглядит типичный котик, насколько разнообразными являются котики в целом и в каком диапазоне лежит норма по тому или иному признаку.




Aleksandr