Статистика измерений - Математика курсовая работа

Статистика измерений - Математика курсовая работа




































Главная

Математика
Статистика измерений

Определение закона распределения вероятностей результатов измерения в математической статистике. Проверка соответствия эмпирического распределения теоретическому. Определение доверительного интервала, в котором лежит значение измеряемой величины.


посмотреть текст работы


скачать работу можно здесь


полная информация о работе


весь список подобных работ


Нужна помощь с учёбой? Наши эксперты готовы помочь!
Нажимая на кнопку, вы соглашаетесь с
политикой обработки персональных данных

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
вероятность измерение математическая статистика
1. Определение закона распределения вероятностей результатов измерения
2. Проверка соответствия эмпирического распределения теоретическому
3. Определение доверительного интервала, в котором лежит значение измеряемой величины
Данные по выборке - вариант 30 - для расчета
Математическая статистика - раздел математики, который занимается разработкой методов получения научно обоснованных выводов о массовых явлениях и процессах по данным наблюдений или экспериментов. Например, по имеющейся информации о числе бракованных изделий в партии готовой продукции надо сделать вывод о качестве используемого технологического процесса.
Математическая статистика предполагает вероятностную природу данных наблюдений, поэтому она основана на понятиях и методах теории вероятностей.
Задачи математической статистики в известной мере являются обратными к задачам теории вероятностей. Если в теории вероятностей вероятностную модель случайного явления считают заданной и делают расчет вероятностей интересующих событий, то в математической статистике исходят из того, что вероятностная модель не задана (или задана не полностью), а в результате эксперимента стали известны реализации каких-либо случайных событий. На основе статистических данных математическая статистика подбирает подходящую вероятностную модель для получения вывода о рассматриваемом явлении или процессе.
В настоящее время математическая статистика является обширным разделом математики.
Цель работы: закрепить пройденный материал по математической статистике
Задачи, поставленные перед автором работы:
1. Составить статистическое распределение выборки значений данной случайной величины. Построить сгруппированный ряд.
2. Построить полигон относительных частот, эмпирическую функцию распределения, кумулянту и гистограмму, выдвинуть гипотезу о виде распределения для простого и сгруппированного ряда распределения.
3. Найти точечные оценки неизвестных числовых характеристик: .
4. Найти интервальные оценки параметров M(X), s (X), в предположении, что X » N ( a ,s ) с надёжностью 0,95.
5. Проверить гипотезы:при различных конкурирующих гипотезах с уровнем значимости: 0,05.
6. Проверить гипотезу о нормальном распределении исследуемого
распределения с уровнем значимости 0,05: .
7. Полученные результаты проанализировать и сделать общие выводы.
В начале 30-х годов на стыке экономической практики и математической статистики зародилась новая самостоятельная дисциплина, получившая название "Эконометрика1". Математическая статистика является универсальным аппаратом, используемым в различных эконометрических исследованиях.
Работа исследователя обязательно содержит этап математической обработки результатов проведенных экспериментов. Современная научно-исследовательская аппаратура имеет встроенные процессоры и сопряжение с персональными компьютерами, что позволяет автоматизировать определенные этапы математической обработки получаемой информации. Этот процесс облегчает технику вычислений, но требует от исследователя принципиального знания используемых методов, их достоинств, недостатков и границ их применимости.
Современная математическая статистика разрабатывает способы определения числа необходимых испытаний до начала исследования (планирования эксперимента), в ходе исследования (последовательный анализ). Её можно определить как науку о принятии решений в условии неопределённости.
Данная работа выполнялась на персональном компьютере с использованием Excel и профессионального пакета программ версии Statistic 9.5.8.
Анализ распределений направлен на выявление закономерности изменения частот в зависимости от значений варьирующего признака и анализ различных характеристик изучаемого распределения. Прежде, чем приступить к вычислению специальных статистических показателей, необходимо из исходной совокупности исключить единицы, не подчиняющиеся общей закономерности распределения, так называемые выбросы. Выбросы - это значения признака, резко отличающиеся как в большую, так и в меньшую сторону, от значений признака основной части единиц совокупности .
Для локализации и устранения выбросов необходимо, прежде всего, ранжировать исходные данные. Затем, в ППП Statistic 9.5.8. строится график Box plot на основании ранжированной совокупности. Единицы совокупности, обозначенные на графике звёздочками (*), являются выбросами, которые необходимо исключить из изучаемой совокупности (данная процедура использовалась только для контроля получаемых результатов).
Вариационным называется ряд распределения, построенный по количественному признаку. Он может быть представлен в виде таблицы и графически. Табличное представление позволяет не только выявить ту или иную закономерность распределения, но и подробно охарактеризовать структуру изучаемой совокупности.
Таблицы вариационных рядов строятся по принципам группировки. Известные проблемы возникают при определении числа групп, поскольку формула Стерджеса, рекомендуемая для этих целей, дает приемлемые результаты только в условиях больших статистических совокупностей. Процесс определения числа выделяемых групп, в значительной степени, носит творческий характер и требует от исследователя применения не только теоретических знаний, но и практического опыта и интуиции.
где k - число групп; N - объем совокупности.
Использование ППП значительно упрощает задачу табличного представления вариационного ряда, поскольку позволяет с малыми временными затратами просмотреть несколько таблиц с разным числом групп и размером группировочного интервала. Конечный вариант таблицы должен отвечать следующим требованиям: в таблице не должно быть малонаполненных и нулевых групп; нужно стремиться к получению мономодального распределения (т.е. по обе стороны от максимальной частоты должно наблюдаться закономерное убывание частот). Если не удается избавиться от многовершинности в распределении, это, как правило, означает, что изучаемая статистическая совокупность неоднородна и требует более детального изучения. В этих условиях следует либо работать с выбросами, либо, если единицы совокупности не подчиняются единой закономерности распределения, разбить совокупность на объективно существующие группы, и анализировать их раздельно.
Ряд распределения - это распределение единиц совокупности по значению того или иного признака. Комплексный анализ ряда распределения включает:
- Табличное и графическое представление ряда распределения;
- Расчёт и анализ показателей центра и структуры распределения;
- Расчёт и анализ показателей вариации;
- Характеристику формы распределения;
- Выбор теоретического распределения, которому соответствует изучаемое эмпирическое [1].
Одна из важнейших целей изучения рядов распределения состоит в том, чтобы выявить закономерность распределения и определить ее характер. Закономерности распределения наиболее отчетливо проявляются только при большом количестве наблюдений (т.н. закон больших чисел).
1. Определение закона распределения вероятностей р е зультатов измерений
Весь массив экспериментальных данных характеризует результат измерения Х. Он может быть также описан с помощью функции распределения вероятности. Но необходимо проверить, не было ли допущено ошибок при получении отдельных значений результата измерений.
Все результаты заданной группировки результатов измерений, ранжируем в порядке возрастания. Они представляют собой вариационный ряд.
Сведем в таблицу 1 все данные и вычислим основные «оценочные» характеристики.
Таблица 1. Обработка результатов измерений.
1. Определим среднюю арифметическую значений заданной выборки:
Для того, чтобы использовать данную формулу в Excel, вводим исходные данные в таблицу, устанавливаем курсор в свободную ячейку и вызываем Мастер функций. В открывшимся диалоговом окне выбираем категорию Статистические. В нашем случае - взвешенная средняя арифметическая. Для ее вычисления используем комбинацию функций СУММПРОИЗВ и СУММ.
В качестве диапазона значений указываем ячейки, содержащие наши числовые данные. Клик по ОК завершит процесс вычисления. Среднее арифметическое отображается в выделенной ячейке.
Для характеристики величины возможных колебаний наблюдаемых единиц совокупности необходимо вычислить: средний квадрат отклонения (дисперсия) и среднее квадратическое отклонение.
2. Определяем несмещенный центр дисперсии результата измерения.
3. Определяем среднее квадратическое отклонение.
Формулы в Excel для их вычисления: СРОТКЛ и КВАДРОТКЛ.
4. Для исключения из выборки ошибок определим: 3у = 3*0,388 = 1,164.
И исключим значения х i , отличающиеся от среднего значения больше чем на 3у:
Это будут значения под номерами: №№ 82 - 86.
Будем работать с членами вариационного ряда под номерами 1 - 81 (таблица 2). И вычислим для этого диапазона те же характеристики.
Таблица 2. Вариационный ряд с исключенными промахами 82 - 86.
а.Средняя арифметическая значений заданной выборки:
б.Несмещенный центр дисперсии результата измерения.
Вновь отбрасываем «ошибочные» значения №№ 80, 81.
Таблица 3. Вариационный ряд с исключенными промахами 81 и 82.
а.Средняя арифметическая значений заданной выборки:
б.Несмещенный центр дисперсии результата измерения.
Вновь отбрасываем «ошибочные» значения №№ 78, 79.
Таблица 4. Вариационный ряд с исключенными промахами 78 и 79.
а.Средняя арифметическая значений заданной выборки:
б.Несмещенный центр дисперсии результата измерения.
И теперь ни одно из оставшихся значений х не отличается от среднего арифметического больше чем на 3у. Можно, следовательно, считать, что среди них нет ошибочных.
4. Рассчитаем следующие дополнительные числовые характеристики полученного статистического ряда:
Размах варьирования вычисляется по формуле:
x max - максимальный элемент вариационного ряда;
x min - минимальный элемент вариационного ряда;
Модой называют варианту с наибольшей частотой повторений.
Из исходной таблицы находим, что наибольшую частоту n =11 имеют варианты x = 0.14.
Если количество вариант число четное, то медиана вычисляется по формуле:
где x k - cто двадцать пятый член вариационного ряда;
x k+1 сто двадцать шестой член вариационного ряда;
М В =(x k +x k +1 )/2=(0,44+0,04)/2= 0,24.
Расчет коэффициента вариации проведем по формуле:
Коэффициент вариации более 33%, следовательно, ряд варьируется слабо!
Размах варьирования является простейшей характеристикой рассеяния вариационного ряда.
Для того чтобы охарактеризовать рассеяние значений количественного признака X генеральной совокупности вокруг своего среднего значения, вводят сводные характеристики - генеральную дисперсию и средним квадратическим отклонением.
Коэффициент вариации служит для сравнения величин рассеяния по отношению к выборочной средней двух вариационных рядов: тот из рядов имеет большее рассеяние, у которого коэффициент больше (эта величина безразмерная поэтому он пригоден для сравнения вариационных рядов, варианты которых имеют различную размерность.
В целом числовые характеристики служат для сравнения рассеяния вариационных рядов в сравнении с аналогичными числовыми характеристиками других вариационных рядов.
4. Определение центральных моментов. Для этого нам понадобятся аналогичные таблицы, содержащие элементы
Определяем четвёртый центральный момент:
Таким образом, ч лежит в пределах (0,0045; 0,67), следовательно, рассматриваемую выборку можно отнести к классу распределений, близких к нормальному, нормальному, показательному, биноминальному.
f(x) = p x (1 - p) n - x - биноминальное распределение;
f(x) = л exp{-лx}, где л = 1/ - показательное.
Произведем оценку центра распределения. Для распределений, близких к нормальному эффективными оценками являются простые оценки Диксона или усечённые средние:
Отбросим два крайних члена совокупности, тогда
Таким образом, получаем вполне удовлетворительный результат с погрешностью всего
Выяснение общего характера распределения предполагает не только оценку степени его однородности (определение , у 2 и у), но и исследование формы распределения, т. е. оценку симметричности и эксцесса).
Рассчитаем на основе центрального момента 3-го порядка коэффициент ассиметрии
Определим третий центральный момент.
Определяем третий центральный момент:
Для оценки существенности рассчитанного коэффициента ассиметрии определяется его средняя квадратическая ошибка (коэффициент ассиметрии):
отношение = = 9.8 3, следовательно, ассиметрия является существенной. Очевидно, что в нашем случае это связано со смещением вершины распределения относительно середины распределения.
Мода распределения в нашем случае Мо = 0,14, а = 0,2844, поэтому форму распределения можно представить как
Так как распределение является одновершинным, то необходимо рассчитать еще один показатель оценки его формы - эксцесс. Эксцесс является показателем островершинности распределения. Он рассчитывается как
Так как Ех 0, то распределение является плосковершинным..
Показатель формы для Ех * = 2,935 2 (находится по специализированным таблицам).
Для изучения показателей формы вариации удобно использовать табличный процессор Excel Он имеет набор средств анализа данных (Пакет анализа), предназначенный для решения статистических и инженерных задач. Вызов осуществляется командой Сервис Анализ данных. Для проведения анализа следует указать входные данные и выбрать параметры. Анализ будет проведен с помощью соответствующей статистической или инженерной функции, а результат будет помещен в выходной диапазон.
Правдоподобно или нет допущение о том, что результат измерения подчиняется нормальному закону распределения вероятности, оценим по виду гистограммы, построенной на основании экспериментальных данных.
Произведём разделение на интервалы рассматриваемую совокупность.
1. Количество интервалов определяем по формуле Старджесса:
r = 1 + 3.33*lg 239 = 1 + 3.33*2.378 = 8.92.
x min = 0.00, тогда d = 1.15/9 = 0.127777,
выбираем шаг равным 0,13, тогда получаем интервальное распределение и составим сводную расчётную таблицу.
Построим гистограмму и полигон для полученного распределения в Excel. Одновременно рассмотрим полученную функцию распределения F(x) и произведём в этом операторе поиск аппроксимирующей функции.
Выбирая окончательный вариант табличного представления вариационного ряда из представленных вариантов, остановимся на первом - n=9.
В таблицах первая непоименованная графа (From To) содержит интервалы значений признака «Количество» Второй столбец «Count» - абсолютные частоты (f i ), т.е. число единиц совокупности, обладающих указанным значением признака.
Cumulative Count - накопленные абсолютные частоты, получаемые последовательным суммированием частот по группам. Сумма накопленных частот по каждой строке означает, какое количество единиц совокупности имеет значение признака, не превышающее значения верхней границы данного интервала. Общая сумма накопленных частот соответствует объему изучаемой совокупности (239).
Percent - частости (относительные частоты, w i ; выражаются в процентах), рассчитываются:
где: f i - число единиц i-той группы; - общее число единиц в совокупности; w i - доля каждой группы в общем объеме совокупности.
Cumulative percent - накопленные частости - это результат последовательного суммирования относительных частот по группам, итоговая сумма, очевидно, равна 100%.
Табличное представление вариационного ряда позволяет получить подробную информацию о составе и структуре изучаемой совокупности, т.е. определить какое количество единиц изучаемой совокупности обладает тем или иным значением признака и какова доля этой группы единиц в общем объеме совокупности, а также выявить закономерность изменения частот.
Из таблицы видно, что наибольшую частоту (85 или 35.6% от всего объема совокупности) имеет интервал 0.00 - 0.13.
Наименьшую частоту (3 или 1.25%) имеет первый интервал - 1.04 - 1.17
Для более наглядного представления вариационного ряда используют статистические графики.
Статистический график представляет собой чертеж, на котором при помощи условных геометрических фигур (линий, точек или других символических знаков) изображаются статистические данные. В результате этого достигается наглядная характеристика изучаемой статистической совокупности.
Правильно построенный график делает статистическую информацию более выразительной, запоминающейся и удобно воспринимаемой.
Традиционно для изображения вариационных рядов распределения в отечественной практике используются графики: гистограмма, полигон, кумулята.
На рис. 1. представлен полигон распределения в абсолютных частотах при количестве интервалов n=9. Он показывает, что наибольшую частоту имеет интервал 0.00 - 0.13 т.е. это модальный интервал.
Одной из часто используемых видов графиков является гистограмма (или столбиковая диаграмма), т.е. график распределения, на котором частоты каждого интервала представлены в виде столбиков (рис. 2).
Рис. 6. Аппроксимация плотности вероятности.
Приблизительная аппроксимирующая функция:
у = 0,476 е -0,39х , с достоверностью 0,919.
2. Проверка соответствия эмпирического распределения те о ретическому
Процедура выравнивания, сглаживания анализируемого распределения заключается в замене эмпирических частот теоретическими, определяемыми по формуле теоретического распределения, но с учетом фактических значений переменной. На основе сопоставления эмпирических и теоретических частот рассчитываются критерии согласия, которые используются для проверки гипотезы о соответствии исследуемого распределения тому или иному типу теоретических распределении.
Выбор конкретного типа модельного распределения осуществляется исходя из самых общих соображений, опирающихся на визуальный анализ построенных графиков распределения. В практическом анализе обязательной является проверка соответствия изучаемого распределения нормальному закону распределения. Необходимость этого связана с тем, что условием применения значительного числа статистических характеристик и оценок является наличие нормального распределения.
Проверка гипотезы о нормальном распределении основывается на расчёте критерия
где - эмпирические абсолютные частоты, - абсолютные частоты теоретического распределения, k - число интервалов.
Формулы, по которым рассчитывается плотность модельного распределения, а также формулы для расчета теоретических частот распределения могут быть легко найдены в общедоступной справочной и учебной литературе. В данной лабораторной работе используются формулы для нормального распределения.
Первая гипотеза Н 0 - нормальное распределение.
Функция нормального распределения: , плотность нормального распределения:
где - значение изучаемого признака, - средняя арифметическая величина, - среднее квадратическое отклонение изучаемого признака, e, р - математические константы, - нормированное отклонение.
Проверку проводим с помощью критерия Пирсона.
В этом задании, с помощью критерии Пирсона проверим гипотезу о нормальном распределении генеральной совокупности, с этой целью будем сравнивать эмпирические и теоретические частоты.
= 0,2844 - Среднее арифметическое значение
у = 0.073 - Оценка среднеквадратического отклонения.
Вычислим теоретические частоты, учитывая
Сравним эмпирические и теоретические частоты.
А) составим расчетную таблицу и из нее найдём наблюдаемое значение критерия
Б) по таблице критических точек распределения ч 2 , по уровню значимости б = 0,05 и числу степеней свободы К = 9 - 3 = 6 находим критическую точку правосторонней критической области
Так как ч 2 - гипотезу о нормальном распределении отвергаем при уровне значимости б = 0,05.
Другими словами, эмпирическое и теоретическое значение частот различимо значительно.
Вторая гипотеза Н 1 - показательное распределение
Проверка гипотезы о показательном распределении совокупности.
= 0,2844 - Среднее арифметическое значение
у = 0.073 - Оценка среднеквадратического отклонения.
1.Найдём оценку параметра предполагаемого показательного распределения:
таким образом, дифференциальная функция предполагаемого показательного распределения имеет вид
2.Находим вероятности попадания х в каждый из интервалов по форме:
P i =P(x i X x i +1 ) = exp{-л} - exp{-лx i +1 }
P 1 (0 x 0.13) = e -3.516*0 - e -3.516*0.13 = 1 - 0.6331 =0.3669
P 2 (0.13 x 0.26) = e -3.516*0.13 - e -3.516*0.26 = 0.6331 - 0.4009 =0.2322.
P 3 (0.26 x 0.39) = e -3.516*0.26 - e -3.516*0.39 = 0.4009 - 0.2538 =0.1471.
P 4 (0.39 x 0.52) = e -3.516*0.39 - e -3.516*0.52 = 0.2538 - 0.1607 =0.0931.
P 5 (0.52 x 0.65) = e -3.516*0.52 - e -3.516*0.65 = 0.1607 - 0.1017 =0.059.
P 6 (0.65 x 0.78) = e -3.516*0.65 - e -3.516*0.78 = 0.1017 - 0.0644 =0.0373.
P 7 (0.78 x 0.91) = e -3.516*0.78 - e -3.516*0.91 = 0.0644 - 0.0409 =0.0236.
P 8 (0.91 x 1.04) = e -3.516*0.91 - e -3.516*1.04 = 0.0409 - 0.0258 =0.0181.
P 9 (1.04 x 1.17) = e -3.516*1.04 - e -3.516*1.17 = 0.0258 - 0.0163 =0.0105.
Контроль: 0,3669 + 0,2322 + 0,1471 + 0,0931 + 0,059 + 0,0373 + 0,0236 + 0,0181 + 0, 105 1.
4. Составим расчетную таблицу и определим из неё наблюдаемое значение критерия Пирсона:.
по таблице критических точек распределения ч 2 , по уровню значимости б = 0,05 и числу степеней свободы К = 9 - 3 = 6 находим критическую точку правосторонней критической области
Так как ч 2 - гипотезу о показательном распределении принимаем!!!.
Исследование показательной функции распределения.
Третья гипотеза Н 2 - биноминальное распределение
Точечная оценка: Если имеется реализация из n = 239 испытаний в которых событие наблюдалось m = 79 раз (как в нашем случае), то несмещенной точечной оценкой максимальной правдоподобности параметра р является величина р n = m/n = 79/239 = 0.3305.
Плотность вероятности биноминального распределения имеет вид:
распределение имеет единственный параметр р.
Интервальная оценка: Интервальные оценки параметра р с доверительной вероятностью б являются решениями уравнений Клоппера-Пирсона
В скобках приведены вероятности, соответствующие границам р н и р в односторонних доверительных интервалов.
Известно, что биноминальное распределение может быть аппроксимировано с помощью бета- и F-распределений, нормального распределения и распределения Пуассона. Поэтому значения р н и р в для двусторонней интервальной оценки можно выразить через квантили этих распределений.
Ввиду сложности биноминальной зависимости - высокий порядок шестой степени - рассмотрим данную зависимость в ППП Statistica 9.5.8.
Получение такого результата в программе Statistic 9.3. объясняется тем, что прежде, чем приступить к вычислению специальных статистических показателей, из исходной совокупности исключаются единицы, не подчиняющиеся общей закономерности распределения, так называемые выбросы. Выбросы - это значения признака, резко отличающиеся как в большую, так и в меньшую сторону, от значений признака основной части единиц совокупности .
Для локализации и устранения выбросов необходимо, прежде всего, ранжировать исходные данные. Затем, в ППП Statistic 9.5.8. строится график Box plot на основании ранжированной совокупности. Единицы совокупности, являющиеся выбросами, исключаются из изучаемой совокупности (данная процедура использовалась только для контроля получаемых результатов).
3.Определение доверительного интервала, в котором лежит значение вероятной величины
Определение доверительного интервала означает оценку для центра распределения. В качестве первичных оценок группирования значений случайных величин могут быть использованы различные предельные неравенства.
где м и у - соответственно среднее значение и стандартное отклонение.
Из неравенства Чебышева следует, что
Это и есть искомый доверительный интервал.
м 0,2844 - 0,27 = (х - 0,0619) = 0,2844 - 0,0619 = 0,2225 и
м 0,2844 + 0,27 = (х + 0,0148) = 0,2844 + 0,0148 = 0,2992.
Тогда, ф = 0,27 2 + (0,2844 - 0,14) 2 = 0,0520,
В курсовой работе были проанализированы данные о распределении проведенных. Для удобства анализа данные были представлены в виде группировочных таблиц с количеством интервалов n=9. Также для удобства анализа вариационного ряда используется графическое представление. В работе были использованы такие виды графиков, как полигон и гистограмма. Полигон, построенный на основе абсолютных частот, показывает форму распределения. Из рисунка видно, что распределение имеет одну вершину, форма его не симметрична, смещена к левому краю и довольно крута.
Также с помощью графика можно определить модальный интервал (0,00 - 0,13). Гистограмма позволяет сделать такие же выводы.
Центральная тенденция распределения характеризуется такими показателями, как среднее арифметическое значение, мода и медиана. Все показатели были определены с помощью программы Statistica по исходному ряду данных и вручную по сгруппированным данным. Среднее арифметическое значение вариационного ряда составило 0,2844 (по исходным данным) и 0,28747 (по группировочной таблице).
Медиана - это величина признака, делящая распределение на две равные части. По исходным данным медиана составила 0,24, а по сгруппированным данным - 0,2409.
Мода - это значение признака с наибольшей частотой. Ее значение составило 0,14. Очевидно, что и среднее арифметическое, и медиана принадлежат одному интервалу, но отличаются по значениям. Мода принадлежит другому интервалу. Это свидетельствует о несимметричности распределения относительно центра.
Вариация - это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени. К показателям, характеризующим вариацию распределения, относятся размах вариации, дисперсия и среднее квадратическое отклонение и коэффициент вариации.
Размах вариации показывает амплитуду вариации и определяется как разница между максимальным и минимальным значением распределения и составляет 1,15.
Дисперсия признака представляет собой средний квадрат отклонений вариантов от их средней величины. Дисперсия, рассчитанная по исходным данным, составила 0,0729, а по сгруппированным - 0,0663. Более удобным для анализа показателем является среднее квадратическое отклонение, которое определяется как корень из дисперсии. Среднее квадратическое отклонение, рассчитанное на основании исходного ряда распределения, равно 0,27, а отклонение, определенное по сгруппированным данным, - 0,25741. Оно показывает, что значение признака отклоняется от среднего арифметического значения в среднем на 0,27.
Коэффициент вариации определяется как отношение среднего квадратического отклонения к среднему арифметическому значению. Этот показатель используют для характеристики однородности совокупности. Значение коэффициента вариации для исследуемого ряда данных составило 94,3%. Поскольку рассчитанное значение коэффициента много больше 33%, то данная совокупность не является количественно однородной.
Форма распределения характеризуется асимметрией и эксцессом. Коэффициент асимметрии показывает, как следует из названия, степень асимметричности распределения и определяется как отношение третьего центрального момента к стандартному отклонению в кубе. Коэффициент асимметрии исследуемого распределения равен -0,341 (по сгруппированным данным - -0,168), что свидетельствует о небольшой левосторонней асимметрии.
Эксцесс характеризует «крутизну» распределения и определяется как отношение четвертого центрального момента к стандартному отклонению в четвертой степени. Для нормального распределения величина эксцесса равна трем, поэтому от рассчитанного значения отнимают 3. Значение эксцесса для анализируемого распределения равно -0,065. Это означает, что исследуемое распределение гораздо «круче» нормального.
Одна из важнейших задач анализа вариационных рядов заключается в выявлении закономерности распределения и определении ее характера. Для этого осуществляется процедура выравнивания и проверка гипотезы о соответствии эмпирического ряда данных теоретическому распределению. В данной работе были проверены гипотезы соответствия эмпирического вариационного ряда нормальному, логнормальному и прямоугольному распределениям с помощью критерия Пирсона. Для этого с помощью программы Statistica было осуществлено сглаживание эмпирического ряда данных путем расчета теоретических частот и сравнение полученных значений с эмпирическими частотами. В результате этих расчетов было получено расчетное значение критерия .
Расчетный критерий для нормального распределения составил 66,207 при количестве степеней свободы 6 и расчетном уровне значимости 0,05. Табличное значение критерия равно 12,6. Поскольку расчетное значение больше критического, гипотеза о нормальном распределении противоречит статистическим данным.
Аналогично были рассчитаны критерии Пирсона для показательного (ч 2 = 8,0168) и биноминального () распределения. Оба критерия значительно не превышают соответствующие табличные значения, следовательно, гипотезы о показательном и биноминальном распределениях подтвердились.
С писок использованной литературы
1. Боровиков В.П., STATISTICA. Искусство анализа данных на компьютере: для профессионалов / В.П. Боровиков. - 2-е изд. - СПб. : - 2003. - 688 с.
2. Венецкий И.Г., Основные математико-статистические понятия и формулы в экономическом анализе. Справочник / И.Г. Венецкий, В.И. Венецкая. - 2-е изд., перераб. и доп. - М. : Статистика, 1979. - 477 с.
3. Гмурнан В.Э. Теория вероятностей и математическая статистика: Учеб. пособие. - М.: Высш. шк., 2003. - 479 с.
4. Гусаров В.М. Статистика: Учеб. пособие для вузов. - М.: ЮНИТИ-ДАНА, 2003. - 463 с.
5. Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник / Под ред. И.И. Елисеевой. - 5-е изд., перераб. и доп. - М.: Финансы и статистика, 2004. - 656 с.
6. Закс Л., Статистическое оценивание: Пер. с нем / Л. Закс. - М.: Статистика, 1976. - 597 с.
7. Н.В. Куприенко Статистика. Методы анализа распределений. Выборочное наблюдение. 3-е изд.: учеб. пособие. / Н.В. Куприенко, О.А. Пономарева, Д.В. Тихонов. - СПб.: Изд-во Политехн. ун-та, 2009. - 138 с.
8. Лялин В.С., Зверева И.Г., Никифорова Н.Г. Статистика. Теория и практика в Excel. М.:
Статистика измерений курсовая работа. Математика.
Компьютерная Графика Реферат
Курсовая работа по теме Экономический расчет напорного ящика закрытого типа
Доклад по теме Выбор
Летние И Зимние Олимпийские Игры Современности Реферат
Реферат На Тему Тибетский Буддизм
Реферат по теме Екатерина II как личность. 'Золотой век' Екатерины
Дипломная работа по теме Методика проведения внеклассных занятий по математике в начальной школе
Реферат: Референдумы и их виды. Скачать бесплатно и без регистрации
Реферат: Бабочки дневные. Скачать бесплатно и без регистрации
Курсовая Работа На Тему Утилизация Отходов
Эссе Учителя Логопеда На Конкурс Учитель Года
Реферат: Term Paper Ice Magic Essay Research Paper
Реферат: Понятие науки
Реферат: Технология изготовления секции корпуса судна
Контрольная Работа На Тему Характеристики Коммуникатора, Способствуещие Эффективной Коммуникации
Курсовая работа: Оценка организации и эффективности лизинга в коммерческих банках
Реферат: Африканский банк развития. Скачать бесплатно и без регистрации
Курсовая работа по теме Экономическое обоснование товарооборота в предприятиях общественного питания
Контрольная работа по теме Криминологические особенности незаконного оборота оружия
Реферат: Этикет и гостеприимство
Деятельность муниципальных органов власти по развитию малого и среднего предпринимательства на примере муниципального образования "город Оренбург" - Государство и право курсовая работа
Поведение дельфинов - Биология и естествознание реферат
Основные направления и проблемы деятельности организации - Государство и право реферат


Report Page