ГС
По представленным данным исследуется вопрос зависимости уровня расходов на туристические поездки (переменная TRAV – Aggregatepersonal expenditures on domestic travel, billions of 1993 dollars) от уровня располагаемых доходов (переменная INC – Aggregate personalincome, billions of 1993 dollars).
(a) Постройте регрессионную модель переменной TRAV на переменную уровня доходов.
Мы построили регрессию – имя – eq01
Проверка стат. качества модели
1.Проверка стат значимости коэфф.
H0: bi=0 (prob > alpha)
H1: bi<>0 – значим (prob <=alfa) alfa(5-10%)
P(b0)=0.3568>10%-> H0 -> коэфф не значим при alfa =10%
P(b1)=0.0000<1%-> H1 -> коэфф значим при alfa =1%
2.Проверка стат. значимости R^2
R^2=0.8531 – модель объясняет 85,3% вариаций переменной TRAV
H0: R^2=0 (prob > alpha)
H1:R^2>0 – значим (prob <=alfa)
Prob(f-stat) = 0.000<1% -> H1 – модель стат. значима
Проверка адекватности (выполнение предпосылок МНК)
1. Проверка спецификации модели (Тест Рамсея)
H0: верная спецификация (P(F)>alfa)
H1: неверная спецификация (P(F)<=alfa)
K=1
Prob(f-stat) = 0.1126>10% -> H0 – верная спецификация модели при alfa=10%
K=2
Prob(f-stat) = 0.2782>10% -> H0 – верная спецификация модели при alfa=10%
2. Нормальное распределение остатков (тест Жака-Бера)
H0: нормальное распределение остатков (P(JB)>alfa)
H1: нет нормального распределение остатков (P(JB)<alfa)
Prob(JB) =0.0000<1% -> H1 – нет нормального распределения остатков
3. Мультиколлинеарность (VIF)
Нет необходимости проверять, т.к. только один х (объясняющая переменная)
4. Автокорреляция
Нет необходимости в проверке, т.к. у нас пространственные данные
1.5<DW=1.5<2,5 – верная спецификация модели
(b) Проанализируйте возможность наличия зависимости между случайными отклонениями модели и экзогенной переменной с помощью графических методов. Сформулируйте предположение о форме такой зависимости, если она подтверждается.
Графический метод:
Сначала мы должны проранжировать наши переменные
Потом копируем данные, отменяем сортировку и вставляем
Теперь мы должны выгрузить ошибку
Называем е
Теперь делаем график
Scatter
Используется график graph01
Наблюдается взаимосвязь между ошибкой прогноза и inc – вероятно есть ГС
(c) Проверьте наличие гомоскедастичности случайных отклонений модели с помощью теста Голдфельда-Квандта согласно схеме (не забывайте проранжировать выборку).
H0: ГО (RSS1=RSS2)
H1: ГС (RSS1<>RSS2)
F_набл= 47.9590089131501 > F_крит(1%; 13-1-1;13-1-1)= 4,46 -> H1 – ГС при альфа 1%
(d) Протестируйте случайные отклонения модели на наличие ГС с помощью теста Вайта.
no-cross: m>3, фиктивные переменные
cross: m<=3
H0: ГО (prob>alfa)
H1: ГС (prob<=alfa)
Wh=Obs*R-squared=4.876820 Prob. Chi-Square(2)=0.0873<10% ->H1 – ГС
(e) Протестируйте случайные отклонения модели на наличие гетероскедастичности с помощью теста Парка. Для этого оцените вспомогательную регрессию, используя соответственно натуральные логарифмы квадратов случайных отклонений и экзогенных переменных исходной модели, и проверьте гипотезу о статистической значимости коэффициента и гомоскедастичности отклонений исходной модели (допуская, в том числе, уровень значимости α=0,10).
eq03
H0: ГО (P(b1)>alfa)
H1: ГС (P(b1)<=alfa)
P(b1)=0.0001 <1% -> H1 ГС обусловленная переменной income
Форма ГС – e^2 ~ INC^1.3 ~ INC^4/3
(f) Протестируйте случайные отклонения модели на наличие гетероскедастичности с помощью теста Глейзера. Для этого выберите значения l={1/3 ; ½ ; 2/3 ; 3/4}, постройте соответствующие вспомогательные регрессии. Сравнивая их качество на основании t-статистик и R2, определите какое значение l наилучшим образом подходит для описания зависимости отклонений исходной модели и переменной Inc и в рамках соответствующей модели проверьте гипотезу о статистической значимости коэффициента и гомоскедастичности отклонений исходной модели.
Тест Глейзера
H0: ГО (P(b1)>alfa)
H1: ГС (P(b1)<=alfa)
eq04
ls abs(e) c inc^(1/3)
L=1/3 R^2= 0.190141
L=1/2 R^2= 0.197317
L=2/3 R^2= 0.199626 – максимальный, анализируем эту модель
L=3/4 R^2= 0.198889
P(b1)=0.0010<1% -> H1 ГС обусловленная переменной INC
Форма ГС – e ~ INC^2/3
Либо e^2~INC^(4/3)
(g) Сделайте общий вывод на основе проделанной работы. Скорректируйте модель при необходимости (рассматриваем нарушения в том числе на 10% уровне значимости).
В модели eq01 доказано наличие ГС
Для исправления ГС используем ВМНК – eq05
Копируем eq01
Используется форма ГС e^2~INC^(4/3)
Вес - INC^(2/3), но в Eviews пишем (4/3)
Тест Вайта
Wh=Obs*R-squared=2.288518 Prob. Chi-Square(3)=0.5147>10% - ГО
Задание 2 (в практикуме задание 2.9 стр.112)
Целью проводимого исследования являлось подтверждение влияния некоторых социально-экономических, медицинских и физиологических факторов на показатель, характеризующий долю мужского населения, страдающего избыточным весом. В качестве экзогенных переменных рассматривались показатели, входящие в статистическую базу Всемирной организации здравоохранения: доля тучных людей в популяции мужчин старше 20 лет (переменная OB –Adults aged ≥ 20 years who are obese, %); процент детей до 5 лет с излишним весом (переменная СH – Children aged <5 years overweight, %); процент мужского населения с повышенным уровнем глюкозы крови (переменная MGI – Raised fasting blood glucose (≥ 7.0 mmol/L or on medication), %) ― как фактор, воздействующий на увеличение массы тела; употребление алкоголя среди взрослых (показатель ALC – Alcohol consumption among adults aged ≥15 years); процент популяции с свободным доступом к питьевой воде (переменная W – Population using improved drinking-water sources, %), как фактор, характеризующий условия жизни; доля городского населения (переменная URB – Living in urban areas, %), как фактор экологических условий.
(a)Рассмотрите модель множественной линейной регрессии OB на остальные показатели. Оцените статистическую адекватность модели согласно стандартной схеме.
eq01
Стат. Значимость коэффициентов
Все коэффициенты одновременно значимы при альфа 2%
Стат. Значимость R^2:
R^2=0.726578 => Модель объясняет 72,6% вариаций переменной OB
P(f)=0.00 < 1% -> модель стат. Значима
Спецификация модели (Тест Рамсея)
K=1
P(f-stat)=0.0158<2% -> H1 – неверная спецификация модели при альфа 2%
Нормальное распределение остатков (Жака-Бера)(Residual - Histogram Normality)
P(JB)=0.641>10% -> H0: нормальное распределение остатков при альфа 10%
Мультиколлинеарность (VIF)
Все значения VIF<10 => МК отсутствует
Автокорреляция
1.5<DW= 2.1<2.5 => нет ошибок спецификации
(b)Проверьте гипотезу о гомоскедастичности случайных отклонений с помощью тестов Вайта, а также теста Парка для каждой из экзогенных переменных. На основании результатов тестирования сделайте вывод: какая из экзогенных переменных находится в тесной взаимосвязи со случайными отклонениями исходной модели?
Тест Вайта
H0: ГО (P>alfa)
H1: ГС (P<=alfa)
m=5 >1 => no-cross
Wh_no-cross: Obs*R-squared=16.66611 Prob. Chi-Square(5)=0.0052<1% => H1 => ГС при альфа 1%
Выявляем переменную
Тест Парка
Выгружаем ошибку e(proc - make residual series)
1.Проверка взаимосвязи между ошибкой и переменной CH
eq02
ls log(e^2) c log(ch)
Если коэфф<>0 то он влияет на ошибку и есть ГС, но т.к. P(b1)>10% -> коэфф = 0
P(b1)=0.9613 > 10% => ГС не обусловлено переменной CH
2.Проверка взаимосвязи между ошибкой и переменной MGI
eq03
P(b2)=0.3446 > 10% => ГС не обусловлено переменной MGI
3.Проверка взаимосвязи между ошибкой и переменной ALC
Тест Парка невозможно осуществить, т.к. есть нулевые значения
4.Проверка взаимосвязи между ошибкой и переменной W
Eq04
P(b4)=0.0386 < 5% => ГС обусловлено переменной W
Форма ГС: e^2~W^2 (1.89 округляем до 2)
5.Проверка взаимосвязи между ошибкой и переменной URB
Eq05
P(b4)=0.0365 < 5% => ГС обусловлено переменной W
Форма ГС: e^2~URB^1 (0.99 округляем до 1)
(c)Оцените модель, используя ВМНК, где в качестве переменной «веса» выберите экзогенную переменную, приводящую к гетероскедастичности согласно результатам тестирования в предыдущем пункте.
Вес 1 – Форма ГС: e^2~W^2
Вес=W^1
Eq06
Obs*R-squared=8.180775 Prob. Chi-Square(5)=0.1466>10% -> H0: ГО
Вес 2 – Форма ГС: e^2~URB^1
Вес=URB^1/2
Eq07
Obs*R-squared=26.48792 Prob. Chi-Square(6)=0.0002<10% -> H1: ГС – применение данного веса не исправило проблему наличия ГС
Вес 3 – Форма ГС: e^2~URB^1 и Форма ГС: e^2~W^2
Вес= (W^2+URB^1)^1/2
Eq08
Prob. Chi-Square(6)=0.2303>10% -> H0 ГО
Общий вывод: можно использовать Вес 1 и Вес 3 для исправления ГС
(d) Оцените статистическую значимость преобразованной модели и проверьте выполнение предпосылки МНК о постоянстве дисперсии отклонений с помощью теста Вайта. Сделайте общий вывод относительно коррекции гетероскедастичности отклонений исходной модели.