Создание макроса на языке Statistica Visual Basic для проверки гипотезы о нормальности остатков регрессии - Программирование, компьютеры и кибернетика курсовая работа

Создание макроса на языке Statistica Visual Basic для проверки гипотезы о нормальности остатков регрессии - Программирование, компьютеры и кибернетика курсовая работа




































Главная

Программирование, компьютеры и кибернетика
Создание макроса на языке Statistica Visual Basic для проверки гипотезы о нормальности остатков регрессии

Создание макроса на языке Statistica Visual Basic (SVB) для проверки гипотезы о нормальности остатков множественной регрессии. Возможности программирования на языке SVB в пакете STATISTICA. Проверка гипотезы в модели вторичного рынка жилья в г. Минске.


посмотреть текст работы


скачать работу можно здесь


полная информация о работе


весь список подобных работ


Нужна помощь с учёбой? Наши эксперты готовы помочь!
Нажимая на кнопку, вы соглашаетесь с
политикой обработки персональных данных

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
ПЕРЕЧЕНЬ УСЛОВНЫХ ОБОЗНАЧЕНИЙ И ТЕРМИНОВ
2. ПРЕДПОСЫЛКИ МЕТОДА НАИМЕНЬШИХ КВАДРАТОВ И ИХ РЕАЛИЗАЦИЯ В STATISTICA
2.1. Модель множественной линейной регрессии
2.3. Проверка гипотезы о нормальности остатков в модуле MULTIPLE REGRESSION STATISTICA
3. СОЗДАНИЕ МАКРОСА ДЛЯ ПРОВЕРКИ ГИПОТЕЗЫ О НОРМАЛЬНОСТИ ОСТАТКОВ
3.2. Проверка гипотезы о нормальности остатков в модели вторичного рынка жилья в г. Минске
ПРИЛОЖЕНИЕ В. Глобальные переменные
ПЕРЕЧЕНЬ УСЛОВНЫХ ОБОЗНАЧЕНИЙ И ТЕРМИНОВ
Множественная линейная регрессия выражает линейные связи между переменными в уравнении при нормальном распределении остатков. Если эти предположения нарушены, заключение не может быть точным, т.е. модель не может быть использована для принятия решений и осуществления прогнозов. В связи с этим при построении модели множественной линейной регрессии особое внимание необходимо уделять проверке гипотезы о нормальном распределении остатков.
Создание макросов - полезная и зачастую необходимая процедура, которая присутствует во многих программных продуктах, в том числе и в программе STATISTICA. Основное ее назначение - автоматизация обработки данных и соответственно значительная экономия времени. В ходе выполнения множественного регрессионного анализа в модуле Multiple Regression пакета STATISTICA исследование остатков на нормальность можно осуществить лишь графическими методами, что приводит к необходимости обращаться к другому встроенному модулю (Distribution Fitting), что требует значительных затрат времени. Для решения данной проблемы был написан макрос на языке SVB.
Предметом исследования данной работы является создание макроса для проверки гипотезы о нормальности остатков множественной регрессии.
Целью данной курсовой работы является создание макроса на языке SVB для проверки гипотезы о нормальности остатков множественной регрессии.
Для достижения поставленной цели необходимо решить следующие задачи:
- изучить возможности программирования на языке SVB в пакете STATISTICA;
- рассмотреть модель множественной линейной регрессии и предпосылки МНК;
- описать процесс проверки гипотезы о нормальности остатков в модуле MULTIPLE REGRESSION STATISTICA;
- создать макрос для проверки гипотезы о нормальности остатков;
- осуществить проверку гипотезы о нормальности остатков в модели вторичного рынка жилья в г. Минске.
В курсовой работе использованы анализ и синтез, аналитический метод, графический метод, методы моделирования и проектирования.
Работа представлена на 48 страницах и состоит из введения, трех разделов (пяти подразделов), заключения, списка использованных источников, приложений.
В первом разделе исследуются возможности программирования на языке SVB в пакете STATISTICA. Во втором разделе раскрываются предпосылки МНК и их реализация в STATISTICA. Третий раздел носит исследовательский характер. В нем описывается создание и применение макроса для проверки гипотезы о нормальности остатков.
В данной курсовой работе была использована литература отечественных и зарубежных авторов. Большое внимание уделялось учебным пособиям таких авторов, как И.И. Елисеева, О.Н. Салманов, Кристофер Доугерти и др. При написании курсовой работы также были использованы данные Интернет-источников.
STATISTICA Visual Basic (SVB) - это язык программирования, интегрированный в программу STATISTICA. Он предоставляет намного больше возможностей, чем просто "вспомогательный язык программирования". SVB использует огромные преимущества объектно-ориентированной структуры системы STATISTICA и позволяет получить доступ практически ко всем функциональным возможностям пакета программными средствами. [советник по макросам-СПМ]
Очень часто при статистической обработке однотипных наборов данных приходится периодически и многократно выполнять одну и ту же серию операций. Сложные процедуры анализа и графический вывод результатов можно записать как макрос SVB для дальнейшего использования и редактирования. Макросы представляют собой самостоятельные блоки, которые легко встраиваются в другие приложения. [советник по макросам-СПМ]
Существует несколько методов создания макросов SVB:
1. Автоматическая запись макроса. Каждый раз при выполнении процедур из меню Statistics или Graphs , SVB записывает в фоновом режиме программный код, соответствующий всем спецификациям процедур и параметрам вывода. Этот код может впоследствии многократно выполняться и редактироваться. В процессе редактирования можно изменять настройки процедур анализа, используемые переменные и их спецификации, файлы данных, добавлять элементы пользовательского интерфейса и т.д.
2. Макросы могут быть написаны с нуля с помощью профессиональной среды разработчика SVB. Данная среда представляет собой удобный редактор программного кода с мощным отладчиком. Кроме того, имеется наглядный мастер создания диалогов, а также множество других удобных функций для эффективного написания макросов.
SVB макросы могут создаваться на основе уже готовых программ на VISUAL BASIC, написанных в других приложениях (например, MICROSOFT EXCEL), путем добавления встроенных процедур и функций STATISTICA.[scaner 497-498]
В STATISTICA предусмотрено три категории макросов, которые могут быть автоматически написаны. Для активации этих макросов в меню Tools на панели инструментов выделите команду Macro . [scaner c. 498]
1. Analysis / Graph Macro (макрос анализа/графика) - макросы, создаваемые для конкретных типов анализа из меню Statistics и Graphs . В макрос записываются все настройки, параметры, присущие данному типу анализа, а также переменные, над которыми он проводится. После выбора модуля или процедуры из указанных меню в фоновом режиме осуществляется запись всех выполняемых действий: выбор переменных, изменение параметров и др. В любой момент можно перенести записанную информацию (код макроса VISUAL BASIC ) в окно редактора макросов VISUAL BASIC .
2. Log of Analyses ( Master Macro ) (мастер-макрос (журнал)) - макросы, содержащие любую последовательность модулей из меню Statistics или Graphs . В мастер-макрос записывается последовательность проведенных анализов с указанными для них параметрами и переменными от момента включения записи макроса до ее отключения. Такая запись объединяет различные модули, выбранные в меню Statistics или Graphs . В отличие от простого Analysis Macro , запись Master Macros может быть приостановлена и возобновлена. Запись мастера-макроса начинается при нажатии кнопки записи и приостанавливается нажатием кнопки останова. Все действия, совершенные между этими событиями, записываются в соответствующей последовательности: выбор файлов данных, операции преобразования переменных, выбор элементов и др.
3. Key board Macro (клавиатурный макрос) - макросы, содержащие последовательности нажатия клавиш во время проведения анализа. При остановке записи в окне редактора SVB откроется простая программа, содержащая одну команду SendKeys с символами, которые соответствуют клавишам, нажатым при проведении анализа. Данный тип макроса довольно прост - он не записывает контекст, в котором происходило нажатие клавиш (т.е. команды, которые при этом выбирались), но данное свойство может быть полезно для решения определенных задач. Все три категории макросов имеют одинаковый синтаксис и могут быть впоследствии модифицированы. [scaner c.499] Среда разработки STATISTICA Visual Basic содержит гибкий редактор программ и мощные средства отладки.
Отладка макросов. Среда разработки SVB позволяет устанавливать в программе точки останова, если необходимо приостановить работу макроса на какой-либо строке и проверить значение переменных в этой точке программы. Предусмотрена возможность выполнения макроса по шагам.
Диспетчер объектов. Объекты в SVB организованы в виде иерархического дерева объектов, и этот список можно найти в окне Object Browser - Просмотр объектов.
Мастер функций. Существует множество функций STATISTICA и как правило, они доступны только в SVB. Это расширение языка программирования Visual Basic, например, вероятностные, матричные функции, простые окна диалогов пользователя и т.д.
Редактор диалогов пользователя. Среда программирования SVB содержит все необходимые средства для создания пользовательского интерфейса. Мощные средства User-Dialog Editor - Редактора диалогов позволяют проектировать диалоговые окна, используя мышь. В отличие от Microsoft Visual Basic, созданные пользователем диалоги хранятся вместе с программным кодом как данные типа UserDialog. Такой метод создания диалоговых окон позволяет реализовывать сложные элементы интерфейса, которые легко редактируются в текстовом режиме; кроме того, определяя диалог, как переменную, к нему легко можно обращаться в любом месте программы.
2. ПРЕДПОСЫЛКИ МЕТОДА НАИМЕНЬШИХ КВАДРАТОВ И ИХ РЕАЛИЗАЦИЯ В STATISTICA
2.1 Модель множественной линейной регрессии
В экономической практике часто имеет место сложная, многопричинная статистическая связь между признаками.
Множественная регрессия представляет собой регрессию результативного признака с двумя и большим числом факторов, т.е. модель вида:
Переменная называется зависимой переменной, в то время как переменные называются независимыми переменными.[Afifi-164]
Задача оценки статистической взаимосвязи переменных и формулируется аналогично случаю парной регрессии. Записывается функция , где b - вектор параметров, -случайная ошибка. Предполагается, что эта функция связывает переменную с вектором независимых переменных для данной генеральной совокупности. Предполагается, что ошибки являются случайными величинами с нулевым математическим ожиданием и постоянной дисперсией; и статистически независимы при . Кроме того, для проверки статистической значимости оценок b обычно предполагается, что ошибки нормально распределены.
Для оценивания параметров применяется, как правило, метод наименьших квадратов. Уравнение регрессии с оцененными параметрами имеет вид
Практически в каждом отдельном случае величина у складывается из двух слагаемых:
где -фактическое значение результативного признака;
-теоретическое значение результативного признака, найденное исходя из соответствующей математической функции связи и , т. е. из уравнения регрессии;
- случайная величина, характеризующая отклонения реального значения результативного признака от теоретического, найденного по уравнению регрессии. . [Елисеева-35]
Общий смысл оценивания по методу наименьших квадратов заключается в минимизации суммы квадратов отклонений наблюдаемых значений зависимой переменной () от значений, предсказанных моделью().
Построение уравнения множественной регрессии начинается с решения вопроса о спецификации модели. Она включает в себя два круга вопросов: отбор факторов и выбор вида уравнения регрессии. [Елисеева-91]
Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям.
1. Они должны быть количественно измеримы. [Елисеева-92] Для исследования влияния качественных признаков в модель можно вводить бинарные (фиктивные) переменные , которые, как правило, принимают значение 1, если данный качественный признак присутствует в наблюдении, и значение 0 при его отсутствии.[Магнус 100]
2. Факторы не должны быть интеркоррелированы и тем более находиться в точной функциональной связи.
Если между факторами существует высокая корреляция, то нельзя определить их изолированное влияние на результативный показатель и параметры уравнения регрессии оказываются неинтерпретируемыми. [Елисеева-92]
Коэффициенты интеркорреляции (т. е. корреляции между объясняющими переменными) позволяют исключать из модели дублирующие факторы. Считается, что две переменных явно коллинеарны, т. е. находятся между собой в линейной зависимости, если .
По величине парных коэффициентов корреляции обнаруживается лишь явная коллинеарность факторов. Наибольшие трудности в использовании аппарата множественной регрессии возникают при наличии мультиколлинеарности факторов , когда более чем два фактора связаны между собой линейной зависимостью, т.е. имеет место совокупное воздействие факторов друг на друга. Наличие мультиколлинеарности факторов может означать, что некоторые факторы будут всегда действовать в унисон. В результате вариация в исходных данных перестает быть полностью независимой, и нельзя оценить воздействие каждого фактора в отдельности. Чем сильнее мультиколлинеарность факторов, тем менее надежна оценка распределения суммы объясненной вариации по отдельным факторам с помощью метода наименьших квадратов (МНК). [Елисеева-94]
Выделим некоторые наиболее характерные признаки мультиколлинеарности.
1. Небольшое изменение исходных данных (например, добавление новых наблюдений) приводит к существенному изменению оценок коэффициентов модели.
2. Оценки имеют большие стандартные ошибки, малую значимость, в то время как модель в целом является значимой (высокое значение коэффициента детерминации R 2 и соответствующей F-статистики).
3. Оценки коэффициентов имеют неправильные с точки зрения теории знаки или неоправданно большие значения.[Магнус 94]
Подходы к отбору факторов на основе показателей корреляции могут быть разные. Наиболее широкое применение получили следующие методы построения уравнения множественной регрессии:
Каждый из этих методов по-своему решает проблему отбора факторов, давая в целом близкие результаты - отсев факторов из полного его набора (метод исключения), дополнительное введение фактора (метод включения), исключение ранее введенного фактора (шаговый регрессионный анализ).
Как и в парной зависимости, возможны разные виды уравнений множественной регрессии: линейные и нелинейные. [Елисеева-100] Линейные модели регрессии могут быть описаны как линейные в двух отношениях: как линейные по переменным и как линейные по параметрам. Для линейного регрессионного анализа требуется линейность только по параметрам ( ) , поскольку нелинейность по переменным ( ) может быть устранена с помощью изменения определений.[Доугерти 141]
В линейной множественной регрессии параметры при х называются коэффициентами регрессии ( ) . Они характеризуют среднее изменение результата ( ) с изменением соответствующего фактора ( ) на единицу при неизмененном значении других факторов, закрепленных на среднем уровне. [Елисеева-100]
Оценка значимости коэффициентов чистой регрессии может быть проведена по t-критерию Стьюдента. В этом случае, как и в парной регрессии, для каждого фактора используется формула:
где - коэффициент чистой регрессии при факторе х i ;
- средняя квадратическая ошибка коэффициента регрессии .
Для уравнения множественной регрессии
средняя квадратическая ошибка коэффициента регрессии может быть определена по следующей формуле:
где - среднее квадратическое отклонение для признака у ;
- среднее квадратическое отклонение для признака ;
- коэффициент детерминации для уравнения множественной регрессии;
- коэффициент детерминации для зависимости фактора со всеми другими факторами уравнения множественной регрессии;
- число степеней свободы для остаточной суммы квадратов отклонений. [Елисеева-136-137]
Критический уровень t при любом уровне значимости зависит от числа степеней свободы, которое равно : число наблюдений минус число оцененных параметров. [Доугерти 154]
Практическая значимость уравнения множественной регрессии оценивается с помощью показателя множественной корреляции () и его квадрата - коэффициента детерминации (). [Елисеева-112]
Показатель множественной корреляции может быть найден как индекс множественной корреляции:
где - общая дисперсия результативного признака;
- остаточная дисперсия для уравнения
Границы изменения индекса множественной корреляции: от 0 до 1. Чем ближе его значение к 1, тем теснее связь результативного признака со всем набором исследуемых факторов. [Елисеева-113]
Коэффициент детерминации определяет долю дисперсии , объясненную регрессией. [Доугерти 159]
Значимость уравнения множественной регрессии в целом оценивается с помощью F-критерия Фишера:
где - факторная сумма квадратов на одну степень свободы;
- остаточная сумма квадратов на одну степень свободы;
- коэффициент (индекс) множественной детерминации;
- число параметров при переменных (в линейной регрессии совпадает с числом включенных в модель факторов);
Смысл проверяемой гипотезы заключается в том, что все коэффициенты линейной регрессии, за исключением свободного параметра, равны нулю (случай отсутствия линейной функциональной связи).
Величина F имеет распределение Фишера с степенями свободы . Распределение Фишера - двухпараметрическое распределение неотрицательной случайной величины, являющейся в частном случае при m = 1 квадратом случайной величины, распределенной по Стьюденту. [Салманов 48]. В определенном смысле этот тест дополняет t-тесты, которые используются для проверки значимости вклада отдельных случайных переменных, когда проверяется каждая из гипотез .. [Доугерти 160]
Для проверки нулевой гипотезы при заданном уровне значимости по таблицам находится критическое значение F крит , и нулевая гипотеза отвергается, если .
Распределение Фишера может быть использовано не только для проверки гипотезы об одновременном равенстве нулю всех коэффициентов линейной регрессии, но и гипотезы о равенстве нулю части этих коэффициентов. Это особенно важно при развитии линейной регрессионной модели, так как позволяет оценить обоснованность исключения отдельных переменных или их групп из числа объясняющих переменных или, наоборот, включения их в это число. [Салманов 48].
При оценке параметров уравнения регрессии применяется метод наименьших квадратов (МНК). При этом делаются определенные предпосылки относительно случайной составляющей . В модели
случайная составляющая представляет собой ненаблюдаемую величину. В задачу регрессионного анализа входит не только построение самой модели, но и исследование случайных отклонений , т. е. остаточных величин.
Проверка статистической достоверности коэффициентов регрессии и корреляции осуществляется с помощью t-критерия Стьюдента, F-критерия Фишера и Z-преобразования (для коэффициентов корреляции). При использовании этих критериев делаются предположения относительно поведения остатков - остатки представляют собой независимые случайные величины и их среднее значение равно 0; они имеют одинаковую (постоянную) дисперсию и подчиняются нормальному распределению.
Оценки параметров регрессии должны быть несмещенными, состоятельными и эффективными. Условия, необходимые для получения несмещенных, состоятельных и эффективных оценок, представляют собой предпосылки МНК , соблюдение которых желательно для получения достоверных результатов регрессии.
Исследования остатков предполагают проверку наличия следующих пяти предпосылок МНК:
2) нулевая средняя величина остатков, не зависящая от ;
3) гомоскедастичность - дисперсия каждого отклонения одинакова для всех значений х ;
4) отсутствие автокорреляции остатков. Значения остатков распределены независимо друг от друга;
5) остатки подчиняются нормальному распределению.
Если распределение случайных остатков не соответствует некоторым предпосылкам МНК, то следует корректировать модель.
Прежде всего проверяется случайный xapактер остатков - первая предпосылка МНК.
С этой целью стоится график зависимости остатков от теоретических значений результативного признака (рис. 3.2).
Рис.3.2. Зависимость случайных остатков от теоретических значений
Если на графике получена горизонтальная полоса, то остатки представляют собой случайные величины и MНK оправдан, теоретические значения хорошо аппроксимирует фактические значения у .
Возможны следующие случаи: если зависит от , то:
б) остатки не имеют постоянной дисперсии;
в) остатки носят систематический характер.
В случаях а), б), в) необходимо либо применять другую функцию, либо вводить дополнительную информацию и заново строить уравнение регрессии до тех пор, пока остатки не будут случайными величинами.
Вторая предпосылка МНК относительно нулевой средней величины остатков означает, что. Это выполнимо для линейных моделей и моделей, нелинейных относительно включаемых переменных.
Вместе с тем несмещенность оценок коэффициентов регрессии, полученных МНК, зависит от независимости случайных остатков и величин х, что также исследуется в рамках соблюдения второй предпосылки МНК. С этой целью строится график зависимости случайных остатков от факторов, включенных в регрессию (рис. 3.4).
Рис. 3.4. Зависимость случайных остатков от величины фактора
Если остатки на графике расположены в виде горизонтальной полосы (рис. 3.4), то они независимы от значений . Если же график показывает наличие зависимости и , то модель неадекватна.
Предпосылка о нормальном распределении остатков позволяет проводить проверку параметров регрессии и корреляции с помощью критериев t, F.[1] Всегда, прежде чем сделать окончательные выводы, стоит рассмотреть распределения представляющих интерес переменных. Можно построить гистограммы или нормальные вероятностные графики остатков для визуального анализа их распределения.[электрон-уч]
В соответствии с третьей предпосылкой МНК требуется, чтобы дисперсия остатков была гомоскедастичной. Это значит, что для каждого значения фактора остатки имеют одинаковую дисперсию. Если это условие применения МНК не соблюдается, то имеет место гетероскедастичность. Наличие гетероскедастичности можно наглядно видеть из поля корреляции (рис. 3.5).
Рис. 3.5. Пример гетероскедастичности: дисперсия остатков растет по мере увеличения х;
Используя трехмерное изображение, получим следующие графики, иллюстрирующие гомо- и гетероскедастичность (рис. 3.6, 3.7).
Рис. 3.6. Гомоскедастичность остатков
Рис. 3.7. Гетероскедастичность остатков
Рис. 3.6 показывает, что для каждого значения распределения остатков одинаковы в отличие от рис. 3.7, где диапазон варьирования остатков меняется с переходом от одного значения другому. Соответственно на рис. 3.7 демонстрируется неодинаковая дисперсия при разных значениях .
Наличие гомоскедастичности или гетероскедастичности можно видеть и по рассмотренному выше графику зависимости остатков от теоретических значений результативного признака . Так, для рис 3.5 зависимость остатков от представлена на рис. 3.8.
Рис. 3.8. Гетероскедастичность: большая дисперсия для больших значений
При построении рефессионных моделей чрезвычайно важно соблюдение четвертой предпосылки МНК - отсутствие автокорреляции остатков, т. е. значения остатков , распределены независимо друг от друга. Автокорреляция остатков означает наличие корреляции между остатками текущих и предыдущих (последующих) наблюдений. [1]
Одним из основных предполагаемых свойств отклонений от регрессионной модели является их статистическая независимость между собой. Поскольку значени остаются неизвестными, то проверяется статистическая независимость их аналогов -- отклонения (наблюдаемые значения ошибок). При этом устанавливается некоррелированность сдвинутыми на период величинами . Для этих величин можно рассчитать коэффициент автокорреляции первого порядка (выборочный коэффициент корреляции между и ):
На практике в качестве теста используют тесно связанную с коэффициентом автокорреляции статистику Дарбина -- Уотсона . Тест Дарбина -- Уотсона ( DW ) на наличие или отсутствие автокорреляции ошибок рассчитывается по формуле:
Нулевая гипотеза состоит в отсутствии автокорреляции. Статистику Дарбина-Уотсона можно выразить через коэффициент автокорреляции:
Содержательный смысл статистики Дарбина-Уотсона заключается в следующем: если между и имеется достаточно высокая положительная корреляция, то и близки друг другу и величина статистики DW мала . Это согласуется с последним выражением: если коэффициент близок к единице, то величина D W близка к нулю. Отсутствие корреляции означает, что DW близка к 2. [3]
Если бы распределение статистики DW было известно, то для проверки гипотезы против альтернативы можно было бы для заданного уровня значимости (например, для 5%-уровня) найти такое критическое значение , что если, то гипотеза Н о не отвергается, в противном случае она отвергается в пользу Н 1 . Проблема, однако, состоит в том, что распределение DW зависит не только от числа наблюдений п и количества регрессоров к, но и от всей матрицы X , и, значит, практическое применение этой процедуры невозможно. Тем не менее, Дарбин и Уотсон доказали, что существуют две границы, обычно обозначаемые и , (и = upper - верхняя, l = low - нижняя), которые зависят лишь от n , к и уровня значимости (а следовательно, могут быть затабулированы) и обладают следующим свойством: если , то и, значит, гипотеза H 0 не отвергается, а если то, и гипотеза Н о отвергается в пользу H 1 . В случае ситуация неопределенна, т. е. нельзя высказаться в пользу той или иной гипотезы. Если альтернативной является гипотеза об отрицательной корреляции, то соответствующими верхними и нижними границами будут 4- d l и 4- d u . Целесообразно представить эти результаты в виде следующей таблицы.
Гипотеза Но отвергается, есть отрицательная корреляция
Гипотеза Но отвергается, есть положительная корреляция
Наличие зоны неопределенности, представляет определенные трудности при использовании теста Дарбина-Уотсона. [3]
Отсутствие автокорреляции остаточных величин обеспечивает состоятельность и эффективность оценок коэффициентов регрессии.
При несоблюдении основных предпосылок МНК приходится корректировать модель, изменяя ее спецификацию, добавлять (исключать) некоторые факторы, преобразовывать исходные данные для того, чтобы получить оценки коэффициентов регрессии, которые обладают свойством несмещенности, имеют меньшее значение дисперсии остатков и обеспечивают в связи с этим более эффективную статистическую проверку значимости параметров регрессии. [1]
2.3 Проверка гипотезы о нормальности остатков в модуле Multiple Regression Statistica
STATISTICA является интегрированной системой комплексного статистического анализа и обработки данных в среде Windows. Все методы обработки в системе разбиты на несколько групп - модулей - в соответствии с основными разделами статистического анализа. Модуль Multiple Regression -Множественная регрессия включает в себя набор средств множественной линейной и фиксированной нелинейной (в частности, полиномиальной, экспоненциальной, логарифмической и др.) регрессии, включая пошаговые, иерархические и другие методы. Система STATISTICA позволяет вычислить всесторонний набор статистик и расширенной диагностики, включая полную регрессионную таблицу, частные и частичные корреляции и ковариации для регрессионных весов, статистику Дарбина-Уотсона и многие другие. Анализ остатков и выбросов может быть проведен при помощи широкого набора графиков. [Салманов, с. 245-246]
Модуль Multiple Regression запускается из меню Statistics . Нажмите кнопку Variable на Multiple Linear Regression - Quick tab (Множественная линейная регрессия - Быстрая вкладка) и выберите зависимую переменную ( Dependent variable ) и несколько независимых переменных ( Independent variable ) и затем нажмите кнопку ОК . Появится Multiple Regression Results - диалог результатов регрессионного анализа. [Салманов, с. 249]
Окно результатов анализа ( Multiple Regression Results ) (рис. 2) имеет следующую структуру: верх окна - информационный. Он состоит из двух частей: в первой части содержится основная информация о результатах оценивания, во второй высвечиваются значимые регрессионные коэффициенты ( significant beta ' s are highlighted ). Внизу окна расположены три вкладки: Quick -быстрый, Advanced -продвинутый и Residuals / assumptions / prediction , на которых находятся функциональные кнопки, позволяющие всесторонне просмотреть результаты анализа.[боровиков 136] Критерий для определения уровня статистической значимости может быть изменен в поле Alpha (значение по умолчанию 0,05) .[Салманов, с. 254]
Рассмотрим информационную часть окна. В ней содержатся краткие сведения о результатах анализа, а именно:
Dependent - имя зависимой переменной
No . of с ases - число случаев, по которым построена регрессия
Multiple R - коэффициент множественной корреляции
* R 2 - коэффициент детерминации (квадрат коэффициента множественной корреляции)
* adjusted R 2 - скорректированный коэффициент детерминации
Standard error of estimate - стандартная ошибка оценки
Intercept - оценка свободного члена регрессии, значение коэффициента В 0 в уравнении регрессии.
Std . Error - стандартная ошибка оценки свободного члена, стандартная ошибка коэффициента В 0 в уравнении регрессии.
t ( df ) and p - value - значение t-критерия и уровень р. t-критерий используется для проверки гипотезы о равенстве 0 свободного члена регрессии.
df - число степеней свободы F-критерия.
р - уровень значимости. [боровиков 136-138]
Нажмите на Summary : Regression results на вкладке Quick tab , чтобы отобразить электронную таблицу с бета-коэффициентами.
Эта электронная таблица показывает стандартизированные бета-коэффициенты регрессии ( Beta ) и необработанные коэффициенты регрессии ( В ). Величина этих коэффициентов позволяет сравнивать относительный вклад каждой независимой переменной в предсказании зависимой переменной. Приводится также t - статистика и соответствующее значение вероятности ( р ) для проверки гипотезы о достоверности этих коэффициентов. [Салманов, с. 254-255]
После того как доказана адекватность модели, полученные результаты можно уверенно использовать для дальнейших действий. Анализ адекватности основывается на анализе остатков. [боровиков 139] Для анализа остатков на вкладке Multiple Regression Results - Residuals / assumptions / prediction tab нажмите кнопку диалога Residual Analysis . [Салманов, с. 256] Здесь имеется возможность рассчитать статистику Дарбина-Уотсона, удаленные остатки, доверительные интервалы для
Создание макроса на языке Statistica Visual Basic для проверки гипотезы о нормальности остатков регрессии курсовая работа. Программирование, компьютеры и кибернетика.
Реферат по теме Ваш работник за компьютером
Реферат: Национальные парки Намибии
Дневник Практики Процедурной Медсестры Заполненный По Дням
Реферат: Рак желудка. Скачать бесплатно и без регистрации
Реферат: Иранская революция 1905-1907 гг
Отчет по практике по теме Изучение работы производственного предприятия ООО 'Торгово-промышленный союз'
Дипломная работа: Комплексная механизация уборки кукурузы на силос уборочным комплексом КПК-3000 "Полесье"
Курсовая работа: Хлібопекарські властивості борошна
Курсовая работа: Дільник частоти з коефіцієнтом ділення К = 210 на JK-тригерах
Контрольная работа по теме Анализ финансового состояния организации
Реферат: Euthanasia 7 Essay Research Paper EuthanasiaIn this
Гост Для Курсовой Работы В Word
Сочинение Про Путешествие В Египет
Учебное пособие: Методы исследования рыбы
Контрольная работа по теме Понятие компьютерной сети
Лабораторная Работа По Физике Минькова
Реферат: Кибернетика как наука
Әлеуметтік Желілердің Пайдасы Мен Зияны Реферат
Контрольная работа: Кредитная система России в период НЭПа
Будет Эссе Игра
Методы исследования потребительского поведения - Маркетинг, реклама и торговля реферат
База данных магазина видеоигр - Программирование, компьютеры и кибернетика контрольная работа
Кодифікація права в Україні у складі Австрійської монархії в II половині XVIII-на початку XIX століття - Государство и право курсовая работа


Report Page