Выборочный метод - Социология и обществознание лекция

Выборочный метод - Социология и обществознание лекция



































Ознакомление с методикой проведения выборочного обследования, определением ошибок. Сплошное выборочное наблюдение. Статистические оценки. Оценка доли признака. Точечные оценки для средней и дисперсии генеральной совокупности. Интервальные оценки средней.


посмотреть текст работы


скачать работу можно здесь


полная информация о работе


весь список подобных работ


Нужна помощь с учёбой? Наши эксперты готовы помочь!
Нажимая на кнопку, вы соглашаетесь с
политикой обработки персональных данных

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

3.4 Точечные оценки для средней и дисперсии генеральной совокупности
Цель: ознакомить с методикой проведения выборочного обследования, определения ошибок выборки; распределению их на генеральную совокупность.
После изучения вы сможете: определять выборочные характеристики (средние, ошибки выборки) и распространить их на генеральную совокупность.
1. Статистика: Учебник/Под ред. И.И. Елисеевой. - М.: Крокус, 2008
2. Теория статистики: Учебник/Под ред. Г.П. Громыко. - М.: ИНФРА-М, 2000.
3. Галкина В.А. Статистика: Учебное пособие: М.: РГАЗУ,2002.
4. Курс теории статистики: Учебник/Под ред. В.Н. Салина, Э.Ю. Чурикова. - М.: Финансы и Статистика, 2006.
5. Статистика. Учебник/Л.П. Харченко, В.Г. Ионин, В.В. Глинский. -М.: ИНФРА-М, 2008.
Содержание темы: включает вопросы проведения и определения характеристик выборочного наблюдения. Основными понятиями являются виды отбора единиц совокупности; статистические оценки выборочной и генеральной совокупности.
выборочное обследование генеральная совокупность
Статистическое наблюдение может быть сплошным или выборочным. Сплошное наблюдение предполагает наблюдение (измерение, исследование и т.д.) всех изучаемых объектов. Однако по ряду причин оно может оказаться принципиально неосуществимым или практически нецелесообразным. В таких случаях прибегают к наблюдению части изучаемых объектов и по его результатам делают выводы о свойствах всей совокупности. Такой метод наблюдения получил название выборочного, отобранная для изучения часть объектов называется выборкой, а вся исходная совокупность объектов -- генеральной совокупностью.
Способ отбора элементов генеральной совокупности может быть случайным или неслучайный. При случайном отборе все элементы генеральной совокупности имеют равную вероятность попасть в выборку. Применение такого способа отбора позволяет положить в основу статистических выводов хорошо разработанные математиками вероятностные модели, закон больших чисел, методы изучения закономерностей случайных явлений.
Случайный отбор может производиться по схеме возвращаемого (возвратная выборка) или невозвращаемого (безвозвратная выборка) шара.
На практике выборка производится обычно как безвозвратная. Однако в теоретическом плане проще возвратная выборка, моделью которой служит схема повторных независимых испытаний. Поэтому в математической статистике, как правило, вначале подробно исследуется случай возвратной выборки, а затем указываются модификации статистических выводов при переходе к безвозвратному способу отбора.
Отличие этих выборок тем меньше, чем меньше отношение объема выборки к объему генеральной совокупности. Практически, если отношение составляет меньше 5--10%, этим отличием можно пренебречь и пользоваться более простыми соотношениями, предполагающими возвратную выборку.
Одна из важных задач математической статистики заключается в том, чтобы по данным случайной выборки оценить достаточно точно значения характеристик генерального распределения, как, например, долю признака, среднюю, дисперсию и т. д. Задачу об оценке можно разделить на две части: какую величину, подсчитанную по выборке, принять в качестве приближенного значения характеристики генерального распределения (точечная оценка), и в каком интервале вокруг этой величины будет заключена с заданной надежностью искомая характеристика (интервальная оценка).
Пусть генеральное распределение задается некоторой функцией F ( x ,о1,…,о к) , где о1,… , о к - его параметры. Например, если распределение задается двумя параметрами о 1 и о 2 , то о 1 обычно характеризует среднюю, а о 2 - дисперсию (или среднее квадратическое отклонение) генерального распределения.
Случайный отбор позволяет выборку объема п рассматривать как п повторных испытаний. Результат каждого испытания ( j - го единичного отбора) есть случайная величина Х j , а вся выборка -- совокупность п случайных величин { Х 1 , … Х j , ..., Х п } Любая конкретная выборка (х 1 , ..., х i , ..., х п ) есть реализация этой совокупности случайных величин.
Для оценки неизвестного параметра о генеральной совокупности введем некоторую величину и, вычисляемую по результатам выборки, т. е.
и = и ( X 1 , ..., Х j , ..., Х п ),
Так, если для оценки генеральной средней о = выбрана статистика и = Х* -- выборочная средняя, то ее значения могут быть подсчитаны по результатам выборки как
Если для оценки генеральной дисперсии D выбрана статистика и =D* -- выборочная дисперсия, то ее значения могут быть рассчитаны по формуле
Статистика и есть случайная величина. В ряде случаев можно найти ее распределение.
Статистическая оценка должна быть возможно более точной. С этой целью к статистике и предъявляются требования:
1) Свойство состоятельности означает, что распределение статистики и с ростом объема выборки п концентрируется в сколь угодно малое окрестности параметра о (статистика и стремится по вероятности к оцениваемому параметру о). Свойство состоятельности выражается предельным равенством: для любого столь угодно малого положительного числа е
Свойство состоятельности может быть выражено двумя более жесткими требованиями, которые являются достаточными условиями состоятельности и которые легче поддаются практической проверке:
2) Свойство несмещенности означает, что при любом конечном объеме выборки п центр рассеяния статистики и (математическое ожидание случайной величины и) совпадает со значением оцениваемого параметра генеральной совокупности:
М(и) = о -- для любого п. (1.9.3)
Рис. 1.9.1. Иллюстрация свойств состоятельности
Естественно, что при заданном конечном объеме выборки п из различных возможных статистик для оценки параметра о следует выбрать ту статистику, которая, являясь несмещенной, обладает в то же время минимальным рассеянием, т.е. имеет минимальную дисперсию. Последнее свойство получило название эффективности.
Рис. 1.9.2. Сравнение свойств трех статистик
На рис. 1.9.2 показаны кривые распределения трех статистик. Из них и и и' -- несмещенные и потому для построения оценки предпочтение должно быть отдано статистике и' с меньшей дисперсией. Статистика и" обладает еще меньшей дисперсией, однако она менее пригодна в качестве оценки, так как ее центр рассеяния смещен относительно параметра о`.
Статистику и, принимающую для данной выборки определенное числовое значение, будем называть точечной оценкой параметра о и обозначать той же буквой, что и оцениваемый параметр, помечая ее звездочкой.
Для построения точечных оценок чаще всего применяют метод аналогии, т. е. для оценки параметров генерального распределения выбираются аналогичные параметры (характеристики) выборочного распределения.
Так, для оценки доли признака в генеральной совокупности p=M / N, генеральной средней и генеральной дисперсии
выбираются статистики (соответственно):
При этом в результате дальнейшей проверки устанавливается, что первые две обладают свойством несмещенности, а последняя будет обладать этим свойством, если ее умножить на корректирующий множитель
Условия (1.9.2) и (1.9.3) позволяют для конечного n записать лишь приближенное равенство:
Так как выборка носит случайный характер, то для различных возможных выборок случайная величина о* может принимать различные значения. Поэтому возникает задача дополнить точечную оценку информацией о возможной ее погрешности, т. е. оценить ошибку выборки
Пусть плотность распределения о* изображена на рис. 1.9.3.
Выберем интервал (о - е 1 , о +е 2 ), в котором с достаточно близкой к 1 вероятностью будет заключена величина о*, т. е.
P(-е 1 <о - о* <е 2 ) = l - б (1.9.5*)
Это означает, что в большинстве выборок (доля которых составляет 1-- б ) ошибка выборки попадет в интервал (-е 1 , е 2 ), и лишь в относительно малом числе выборок (доля которых равна б ) ошибка д выйдет за пределы интервала (-е 1 , е 2 ). Поскольку производится одна выборка, то с практической достоверностью (т.е. с вероятностью 1 ? б) можно полагать, что ее ошибка попадет в данный интервал, и, наоборот, практически невозможно (т. е. с вероятностью б), что она выйдет за границы интервала.
Но если е 1 <о - о* <е 2 , то о* - е 1 < о< о*+ е 2 , и равенство (1.9.5*) запишется в виде:
P(о* - е 1 <о <о* +е 2 ) = l ? б (1.9.5)
• интервал (о* - е 1 , о*+е 2 ) называется доверительным интервалом,
• числа о*- е 1 , о*+е 2 - доверительными границами,
• вероятность Р=1--б - доверительной вероятностью и
• б- уровнем значимости (существенности)
Доверительный интервал дополняет точечную оценку о * оценкой ошибки выборки, или интервальной оценкой параметра б.
Если для точечной оценки необходимо знать лишь выражение для о * как функцию данных выборки, то для построения доверительного интервала необходимо знать также закон распределения о *, с помощью которого рассчитывается вероятность (1.9.5).
Часто при симметричном характере распределения случайной величины о * относительно о можно и доверительный интервал рассматривать как симметричный относительно о . В таком случае уравнение (1.9.5) может быть заменено на более простое:
P(о* - е <о <о* +е) = P (¦о - о*¦<е) = l - б (1.9.6)
Величина е называется предельной ошибкой выборки.
С интервальной оценкой связано решение трех типов задач:
1) определение доверительного интервала по заданной доверительной вероятности Р= 1 - б и объему выборки п ;
2) определение доверительной вероятности по заданному доверительному интервалу и объему выборки;
3) определение необходимого объема выборки п по заданным доверительной вероятности и доверительному интервалу.
Для точечной оценки доли признака в генеральной совокупности (р) естественно взять выборочную долю
т -- количество единиц в выборке, обладающих данным признаком.
Можно доказать, что эта оценка является состоятельной, несмещенной, эффективной.
Вопрос об интервальной оценке рассмотрим сначала для случая возвратной выборки.
При такой организации выборки случайная величина p *, как известно из теории вероятностей, имеет биномиальный закон распределения. Расчет доверительного интервала с применением формулы биномиального закона связан с определенными вычислительными трудностями. Однако при достаточно большом объеме выборки (примерно n ? 20, п р ? 10 ) биномиальное распределение хорошо аппроксимируется нормальным распределением с параметрами
Следовательно, случайная величина имеет стандартное нормальное распределение (с параметрами M(z)=0; у(z)=1).
Задавшись определенной вероятностью Р=1-- б, имеем:
где Ф (z б )= -- интегральная функция Лапласа, значения которой для различных значений z рассчитаны и приводятся в специальных таблицах.
Равенство (1.9.7) эквивалентно равенству:
P {¦p*- p ¦ 20--30), то распределение выборочной средней , согласно центральной предельной теореме, независимо от характера генерального распределения приближается к нормальному распределению с параметрами
у-- генеральное среднее квадратическое отклонение,
распределена по стандартному нормальному закону (с математическим ожиданием M ( z ) = 0 и средним квадратическим отклонением у ( z ) = 1).
Задавшись доверительной вероятностью Р = 1 -- б , определяем из равенства 2Ф(z) = 1 -- б соответствующее значение z a (используем при этом таблицу интегральной функции Лапласа). Тогда с вероятностью Р = 1 -- б выполняется неравенство:
Величина называется предельной ошибкой выборки.
Таким образом, мы имеем доверительный интервал для генеральной средней:
Наоборот, если задана предельная ошибка е , а требуется определить вероятность Р, то схема решения задачи следующая:
Наконец, определение объема выборки п по данным Р и е производится по следующей схеме:
Пример 1.9.4. Взвешивание 50 случайно отобранных коробок печенья дало =1200г. Определить с вероятностью Р = 0,95 доверительные границы для среднего веса коробки печенья в генеральной совокупности, если есть основания полагать, что генеральная дисперсия у 2 = 11664.
Дано: n =50; = 1200; у 2 =11664 ( = 108); Р = 0,95.
Из равенства Р = 2Ф( z )=0,95 по таблице значений интегральной функции Лапласа находим z=1,96, откуда:
Таким образом, получаем доверительный интервал:
Пример 1.9.5 Определить, с какой доверительной вероятностью можно утверждать, что при данном объеме выборки (50 коробок) ошибка выборки не превысит 20 г.
По величине е=20 вычисляем , откуда по таблице Ф( z ): Р = 2Ф(1,31)?0,81
Пример 1.9.6. Определить необходимый объем выборки n , который с вероятностью 0,99 гарантировал бы ошибку выборки не более чем е = 20 г.
Из Р = 2Ф( z ) =0,99 находим z = 2,58, откуда:
Предположение о том, что генеральная дисперсия у 2 известна при неизвестной генеральной средней, на практике выполняется весьма редко. Чаще всего мы имеем лишь выборочные данные и можем дать лишь выборочную оценку s 2 неизвестной дисперсии у 2 .
подчиняется закону распределения Стьюдента с v = n --1 степенями свободы. Однако при больших значениях параметра v ( v ? 30) распределение Стьюдента практически совпадает с нормальным. Поэтому в случае больших выборок схема решения задач остается прежней, даже если вместо 'Неизве стного генерального среднего квадратического отклонения а используется его выборочная оценка s .
Если генеральная совокупность подчинена нормальному закону распределения (что на практике имеет место очень часто), то выборочная средняя как средняя арифметическая п нормально распределенных случайных величин также имеет нормальный закон распределения. Таким образом, величина распределена по стандартному нормальному закону, и схема решения задач при известном генеральном среднем квадратическом отклонении у остается прежней.
Если же генеральное среднее квадратическое отклонение у неизвестно и приходится пользоваться его выборочной оценкой s , то используется статистика t (1.9.26), которая, как мы уже отмечали, подчинена закону распределения Стьюдента с v = n --1 степенями свободы. При v < 30 имеются значительные различия между распределением Стьюдента и нормальным распределением (тем более значительные, чем меньше v ). Используя функцию распределения Стьюдента, мы можем записать равенство, аналогичное формуле Лапласа:
где S ( t , v ) -- функция Стьюдента, значения которой для различных значений t и v подробно рассчитаны и представлены в специальных таблицах.
Выражение ( 1.9.27 ) эквивалентно выражению:
Решение задач с помощью этого равенства аналогично решению задач с использованием формулы Лапласа. Лишь определение п несколько усложняется из-за того, что оно входит также в параметр v = n --1.
Поэтому можно воспользоваться схемой последовательных приближений. Вначале производят оценку ( s 2 ) генеральной дисперсии. Затем находят п 1 по схеме (1.9.25), используя таблицу функции Лапласа и принимая у 2 = s 2 - По найденному n 1 и, соответственно, v 1 = n 1 -- 1 и заданному значению
Р =1-- б определяют t 1 (по таблице распределения Стьюдента) и вычисляют и так далее.
Теперь можно снова повторить расчет по v 2 = n 2 -- 1 и т.д.
Итерация заканчивается, если окажется n i ? n i -1 .
Пример 1.9.7. Для определения среднего заработка работника за день при соблюдении необходимых условий было отобрано 10 работников, заработок которых оказался равным (в руб.): 325; 337; 319; 330; 327; 328; 332; 320; 318; 334. Требуется определить с вероятностью 0,95 доверительный интервал для среднего заработка работников в генеральной совокупности, если есть основания полагать, что заработная плата в генеральной совокупности подчиняется нормальному закону определения.
По данным выборки определяем среднюю и дисперсию. Получаем
Рассчитываем несмещенную оценку генеральной дисперсии
Предположение о нормальном характере генерального распределения позволяет нам использовать равенства (1.9.27) и (1.9.28). Обращаясь к таблице значений функции Стьюдента, по заданным P = 2 S ( t , v )=0,95 и v = n --1 = 10 - 1 = 9 находим t = 2,26.
Вычисляем предельную ошибку выборки е=(кг).
Доверительный интервал для генеральной средней:
Пример 1.9.8. Используя данные примера 1.9.7, определить объем выборки, необходимый для того, чтобы ошибка выборочной средней с вероятностью 0,95 не превышала 3 рубля.
Мы имеем оценку генеральной дисперсии s 2 = 42,4. Вначале находим n 1 по формуле (1.9.25), принимая у 2 = s 2 и определяя z по таблице функции Лапласа:
Теперь обращаемся к таблице функции Стьюдента и по Р = 0,95,
v 1 = n 1 --1 ? 17 находим значение t 1 =2,11.
По Р = 0,95 и v 2 = n 2 --1 = 21 - 1 = 20 находим t 2 = 2,09.
Поскольку n 3 ? n 2 , то необходимый объем выборки устанавливается 21 человек.
Еще раз отметим, что рассмотренные выше схемы решения задач для малых выборок справедливы только при предположении нормального характера генерального распределения. При отсутствии такого предположения распределения неизвестно, и выборочную среднюю можно использовать лишь как точечную оценку генеральной средней без оценки точности .приближенного равенства , т. е. без расчета доверительного интервала.
В случае безвозвратной выборки формула для среднего квадратического отклонения выборочной средней, согласно (2.21), примет вид:
Если генеральное среднее квадратическое отклонение у неизвестно (наиболее реальная ситуация), то мы заменяем его точечной оценкой s', которая рассчитывается по формуле (1.9.20). В результате получим:
( . s -- обычное «исправленное» среднее квадратическое отклонение
Во всем остальном ход решения задач как для случая больших выборок, так и для случая малых выборок остается прежним.
Корректирующий множитель при малой величине (например, для 1 или 5% выборок) близок к 1, и поэтому расчеты могут производиться как для возвратной выборки.

Опрос как основной статистический метод изучения общественного мнения. Сущность выборочного метода, принципы и приемы, решаемые задачи. Определение необходимого объема выборки. Пример вычисления средней ошибки для доли бесповторного отбора единиц. курсовая работа [333,1 K], добавлен 08.11.2014
Исследование понятия, основных видов и этапов проведения метода экспертной оценки в социальном прогнозировании. Характеристика дельфийской техники коллективной генерации идей, методов "мозговой атаки", "сценариев", "деловых игр", "совещаний" и "суда". реферат [30,4 K], добавлен 12.07.2011
Понятие и сущность выборочного метода маркетинговых исследований, его основные ошибки. Практическое применение метода в работе предприятий социокультурной деятельности. Определение необходимого объема выборки в исследовании клиентов службы занятости. курсовая работа [106,4 K], добавлен 21.05.2014
Задача построения выборки и стратегии ее решения. Выборочный метод как один из аспектов социологического исследования, его основные цели и задачи. Ознакомление с типами выборки, выявление их достоинств и недостатков. Определение достоверности наблюдений. контрольная работа [33,6 K], добавлен 14.12.2010
Сущность наблюдения, неструктурированное и структурированное, контролируемое и невключенное, систематическое и случайное наблюдение. Этапы подготовки наблюдателей, ознакомление, разбор, пробное наблюдение, наряд-задание, контроль, характеристика задания. реферат [20,7 K], добавлен 28.03.2010
Суть выборочного метода и его роль в социологии. Понятие случайной и систематической ошибки. Генеральная и выборочная совокупность. Случайные и неслучайные выборки в социологии. Стратификация и кластеризация, определение параметров дизайн-эффекта. контрольная работа [130,9 K], добавлен 06.08.2013
Статистический вывод: общее понятие и направления. Оценивание характеристик (параметров) генеральной совокупности по результатам выборочного исследования. Примеры точечных оценок. Пример применения доверительных интервалов в социологическом исследовании. презентация [255,8 K], добавлен 09.10.2013
Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д. PPT, PPTX и PDF-файлы представлены только в архивах. Рекомендуем скачать работу .

© 2000 — 2021



Выборочный метод лекция. Социология и обществознание.
Курсовая работа по теме Исполнение договора аренды зданий и сооружений
Контрольные Работы По Английскому Языку 5
Реферат по теме КРАТКИЙ ОЧЕРК ЭКОНОМИЧЕСКОГО И ПОЛИТИЧЕСКОГО РАЗВИТИЯ СССР (1917-1971 Г.) (ВОЕННО-ПОЛИТИЧЕСКАЯ ОЦЕНКА ОТНОШЕНИЙ СССР - ЗАПАД)
Сочинение На Тему Думай О Хорошем
Сочинение Почему Владимир Стал Разбойником 6 Класс
Характеристика На Студента Проходившего Практику
Реферат: Международная политика продукта. Скачать бесплатно и без регистрации
Ответ на вопрос по теме Источники и отрасли российского права
Курсовая работа по теме Народонаселение Финляндии
Книга На Тему Педагогическая Антропология
Курсовая работа: Договоры на выполнение работ: понятие, виды. Скачать бесплатно и без регистрации
Повествовательное Сочинение 10 Класс
Скачать Реферат Методы Защиты Информации
Отзыв Рецензента На Кандидатскую Диссертацию Исторических Наук
Корпоративная культура в организации (на примере ресторана "Забайкалье")
Лечебно Диагностический Процесс Реферат
История Военного Дела У Бурят Диссертация
Реферат: Symbolic Use Of Ivory In
Судебник Ивана Реферат На 10 Страниц
Реферат На Тему Життя І Творчість Михайла Коцюбинського
Технологія ATM та алгоритм RED - Программирование, компьютеры и кибернетика реферат
Судебное представительство и его виды - Государство и право реферат
Особенности судебного следствия - Государство и право курсовая работа


Report Page