На головну сторінку   Всі книги

Тест Глейзера

Тест Глейзера дозволяє дещо більш ретельно розглянути характер гетероскедастичности. Ми знімаємо припущення про те, що про (. пропорційне х,, і хочемо перевірити, чи може бути більш відповідною яка-небудь інша функціональна форма, наприклад

о,=а + рх/. (7.6)

Щоб використати даний метод, потрібно оцінити регресну залежність у від х з допомогою звичайного МНК, а потім обчислити абсолютні величини залишків ¦е (.¦ по функції (7.6) для даного значення у.

Можна побудувати декілька таких функцій, змінюючи значення у. У кожному випадку нульова гіпотеза про відсутність гетероскедастичности буде відхилена, якщо оцінка р значуще відрізняється від нуля. Якщо при оцінюванні більш ніж однієї функції виходить значуща оцінка р, то орієнтиром при визначенні характеру гетероскедастичности може служити найкраща з них.

Приклад

На основі даних табл. 7.2 по х і ¦ е\ з використанням значень у від -1,0 до 1,5 були оцінені рівняння (7.6). Результати представлені в узагальненому вигляді в табл. 7.3.

У а з. про. (а) Ь С. О. (Ь) R2 F

- 1,0 4,19 0,61 -28,0 14,0 0,11 4,0

- 0,5 5,74 0,80 -17,1 5,0 0,27 11,7

0,5 0,58 0,51 0,24 0,03 0,62 52,7

1,0 2,37 0,42 0,0044 0,0008 0,49 31,1

1.5 2,90 0,44 0,000077 0,000019 0,35 17,5

Потрібно відмітити, що різні оцінки Р незрівнянні, оскільки визначення пояснюючої змінної (х7) в кожному випадку різне. Статистично значущі оцінки були отримані для останніх чотирьох значень у. Рівні коефіцієнта Л2 порівнянні в тому значенні, що залежна змінна в кожному випадку одна і та ж. Найкращий результат відповідає значенню у = 0,5, і, отже, гетероскедастичность апроксимувати рівнянням:

s,= 0,58 + 0,24^. (7.7)

Іншими словами, стандартне відхилення розподілу величини і дійсно збільшується із зростанням х, але не в такій же пропорції.

Вправи 7. 1 Країна МG Країна МG

Бельгія 849 2652 Люксембург 1368 3108

Канада 778 3888 Нідерланди 704 2429

Данія 853 3159 Норвегія 634 2881

Франція 1000 2777 Португалія 215 718

Німеччина 1331 3095 Іспанія 239 957

Греція 185 1091 Швеція 1025 4101

Ірландія 399 1331 Великобританія 609 2174

Італія 554 1731 США 1248 4799

Японія 679 1887

Використовуючи дані з приведеної вище таблиці, дослідник оцінює регресну залежність випуску продукції обробляючої промисловості на душу населення в 1970 р. (М) від валового внутрішнього продукту на душу населення в тому ж році (G) (як М, так і Gизмеряются в доларах США) і отримує формулу (в дужках приводяться стандартні помилки):

1ІЇ = 74,2 + 0,27G; Л2=0,69.

(128,1) (0,05)

Зобразіть діаграму розсіяння, використовуючи дані з таблиці, і поясніть, чому дослідник може підозрювати наявність гетероскед асти чности.

Дослідник оцінює дві «приватні» регресії для шести країн з найменшими значеннями показника G і для шести країн з найбільшими значеннями цього показника. Сума квадратів відхилень становить 20,523 в першому випадку і 313,842 - у другому. Виконайте перевірку на гетероскедастичность по критерію Голдфелда-Квандта.

Як гетероскедастичность буде впливати на властивості коефіцієнтів, що оцінюються?

Що стосується прикладу з державними витратами на освіту, то тут можна висловити думку про те, що гетероскедастичность значною мірою зумовлена спостереженням для США, які в порівнянні з іншими країнами у вибірці мають значно більші значення ЇЇ і GDP. Тому був повторно виконаний тест Голдфелда-Квандта з виключенням з вибірки цього спостереження. Суми квадратів відхилень в регресіях з використанням перших 12 і останніми 12 з 33 спостережень відповідно становили 2,68 і 202,9. Який висновок ви зробите?

Що можна зробити у випадку гетероскедастичности?

Нехай а, - стандартне відхилення випадкового члена в спостереженні /. У тому випадку якби було відомо а, для кожного спостереження, можна було б усунути гетероскедастичность, розділивши кожне спостереження на відповідне йому значення а. Тоді випадковий член в i'-м спостереженні стає рівним і,/а, і його теоретична дисперсія представляється у вигляді:

що дорівнює:

°і

і, отже, воно дорівнює одиниці. Таким чином, кожне спостереження буде

Це вираження переписується як мати випадковий член, отриманий з генеральної сукупності з одиничною дисперсією, і модель буде гомоскедастичной. Тепер модель має вигляд:

у, а 0 х, Uj

- = -+ 3 -+ -gt; (7 8)

а, а, а, а,

що може бути переписано як

у'= av+ ¦} х'+ и', (7.9)

У і. хі .

де у,' визначається як а. gt; х/ являє собою v - нова змінна,

1 і,

/-е спостереження якої рівне " gt; величина і/бути Потрібно відмітити, що

Про/ Про/

в даному рівнянні не повинно бути постійного члена. Оцінюючи регресну залежність у'от v і х', ми дістанемо ефективні оцінки для а і р з незміщеними стандартними помилками.

Математичний доказ того, що рівняння (7.9) дасть більш ефективні оцінки, ніж рівняння (7.1), виходить за рамки даної книги, але тут можна дати просте інтуїтивне пояснення. Спостереження з найменшими значеннями Про/ будуть найбільш корисними для визначення істинної залежності між у їх, оскільки величина випадкового члена в них, як правило, найменша. Ми скористаємося цим, оцінюючи так звану зважену регресію, додаючи найбільші ваги спостереженням самого «високої якості», а найменші ваги - відповідно, спостереженням самого «низької якості». Рівняння (7.9) можна розглядати як «зважений» варіант рівняння (7.1), де значення у їх були помножені на величини І/a,, які, звісно, тим більше, ніж менше з,.

Перешкодою для цієї процедури є те, що вам майже напевно будуть невідомі фактичні значення а,- Однак процедура буде застосовною, якщо ми зможемо підібрати деяку величину, пропорційну, на нашій думку, про в кожному спостереженні, і розділимо на неї обидві частини рівняння.

Допустимо, є основи передбачити, що деяка величина z пропорційна а, і Zj= Хар де X - деяка константа. Після ділення на z рівняння приймає вигляд:

у: а х/ иj

i'VK'i- lt;710gt;

Дисперсія випадкового члена представлена як

що дорівнює 1/А.2.

Отже, ця величина постійна для всіх спостережень, і проблема усунена.

Наприклад, може виявитися доцільним передбачити, що а приблизно пропорційне х, як в критерії Голдфелда-Квандта. Якщо після цього ми розділимо кожне спостереження на відповідне йому значення х, то рівняння (7.1) прийме вигляд:

і при цьому, якщо повезе, новий випадковий член і/х буде мати постійну дисперсію. Потім ми оцінюємо регресну залежність у/х від 1/х, включивши в рівняння постійний член. Коефіцієнт при 1/х буде ефективною оцінкою а, а постійний член - ефективною оцінкою р. У прикладі з витратами на освіту, розглянутому в попередньому розділі, залежною змінною будуть державні витрати на освіту як частка ВВП, а пояснюючої змінної - зворотна до ВВП величина.

Іноді в нашому розпорядженні може виявитися декілька змінних, кожну з яких можна використати для масштабування рівняння. У прикладі з витратами на утворення альтернативної змінної є чисельність населення країни (Р). Розділивши обидві частини рівняння (7.1) на цю величину, отримуємо:

(7.12)

і ми знов сподіваємося на те, що випадковий член и1/Р1 буде мати постійну дисперсію для всіх спостережень. Таким чином, тепер оцінюється регресна залежність державних витрат на утворення на душу населення від ВВП на душу населення і зворотної величини від чисельності населення, причому на цей раз без постійного члена.

На практиці доцільно спробувати використати декілька різних змінних для масштабування спостережень і порівняти потім результати. Якщо кожний раз виходять схожі результати і тести не дають підстав відхиляти нульову гіпотезу об гомоскедастичности, то проблему можна вважати вирішеною.

Приклади

(7.13)

(0,094) (0,004) F= 0,48;

Щ- = -0,0221 + 0,062 ^; R2 = 0,83;

Регресна залежність державних витрат на освіту від ВВП була побудована в двох варіантах: 1) з діленням на ВВП і 2) з діленням на чисельність населення. Дані про чисельність населення, среднедушевих державних витратах на освіту і ВВП на душу населення приводяться в табл. 7.1. Результати виявилися наступними (в дужках приводяться стандартні помилки):

У кожному випадку оцінювалися «приватні» регресії по першим 12 і останнім 12 спостереженням у вибірці, які визначалися упорядкуванням по змінної GDP в першій регресії і по GDP/Р- у другій. У першому випадку RSSX було більше, ніж RSS2, що показує, що перерахунок більш ніж компенсував гетероскедастичность, але при цьому відношення RSSt/RSS2 дорівнювало 1,37 і, отже, було недостатньо високим, щоб вказувати на статистично значущу гетероскедастичность. У другому випадку RSS2/RSSl було дорівнює 4,60, що вказує на те, що нульова гіпотеза об гомоскедастичности повинна бути відхилена при рівні значущості в 5% (критичне значення /становить 2,98).

Після перетворення цих рівнянь зворотно до форми (7.4) можна бачити, що оцінки коефіцієнта при GDP - це такого ж порядку величини, що і в даному рівнянні, але вони декілька нижче. На цій основі було б доцільно зробити висновок про те, що вказаний коефіцієнт ближче до 0,06, ніж до 0,07. Стандартні помилки, як це видно, стали більше, але порівняння їх зі стандартною помилкою коефіцієнта при GDP в рівнянні (7.4) було б некоректним по тій причині, що останній майже напевно був серйозно занижений. Оцінки величини а незначуще відрізняються від нуля як в рівнянні,

так і в рівнянні (7.14).

Може викликати неспокій той, що рівень коефіцієнта детерминації R2 понижчав, ніж в рівнянні (7.4). Дійсно, в рівнянні (7.13) він настільки низький, що /-статистика не відрізняється значуще від нуля навіть при рівні значущості в 5%. Слідує, однак, пам'ятати, що визначення залежної змінної в кожному рівнянні своє, тому значення коефіцієнта Л2 в них незрівнянні. У рівнянні (7.13) коефіцієнт Л2 вимірює пояснюючу здатність змінної 1 /GDP, яка залежить від значущості в початковому рівнянні постійного члена а, а не р. Тепер же параметр Р став постійним членом і тому не може внести який-небудь внесок у величину R2.

Підхід Глейзера

Після виконання тесту Глейзера ми могли усунути гетероскедастичность за рахунок прирівняння z, в рівнянні (7.10) до о, в рівнянні (7.6) і оцінювання регресної залежності gt; Д (від \/s,vixi/si, де ^є оцінкою о,. Після розрахункам, на основі формули (7.7) була оцінена наступна регресія (в дужках дані стандартні помилки):

- = - 0,32 - + 0,059^s Л2 =0,89; (7-15)

Sj Sj Sj

(0,30) (0,003) /= 263,8.

У суті, дане рівняння схоже з рівняннями (7.13) і (7.14). Оцінювання регресної залежності його залишків від GDPt, де у дорівнює -0,5, 0,5 і 1,0, не привело до відхилення нульової гіпотези про наявність гомоскедастичности.

Передбачимо, що істинна модель має нелінійну форму (7.16), розглянуту в розділі 4.3, і що для визначеності р позитивна; таким чином, * є зростаючою функцією від х:

у = axamp;v. (7.16)

Мультипликативний випадковий член v збільшує або зменшує у у відповідній випадковій пропорції. Розподіл імовірностей v однаковий для всіх спостережень, що означає, наприклад, що імовірність зростання * на 2% під дією цієї величини однакова, незалежно від того, є лихий малим або великим. Проте абсолютна величина приросту* на 2% виявляється більшою, коли х приймає високі, а не низькі значення. Отже, буде виявлятися тенденція до більш сильного розкиду спостережень навколо істинної залежності по мірі збільшення х, і лінійна регресна залежність * від х може, отже, показувати гетероскедастичность.

Рішенням тут, звісно, є перехід до логарифмічної регресії. Це не тільки було б більш відповідною математичною специфікацією, але і зробило б модель регресії гомоскедастичной:

log* = loga + р logx + log v. (7.17)

Випадковий член log v тепер впливає на залежну змінну log * аддитивий, тому абсолютна величина його впливу не залежить від величини log х.

Приклад

Оцінка логарифмічної регресної залежності державних витрат на освіту від ВВП з використанням даних табл. 7.1 дає наступні результати (в дужках приводяться стандартні помилки):

log ЇЇ= -3,31 + 1,06 log GDP; Л2 = 0,93; (7.18)

(0,24) (0,05) ? =420,4,

звідки видно, що еластичність величини ЇЇ по об'єму ВВП приблизно рівна одиниці. Для підвищення якості розрахунків була також оцінена логарифмічна регресна залежність державних витрат на утворення на душу населення від ВВП на душу населення:

FF GDP т

log = -3,75 +1,37 log-; R2 = 0,89; (7.19)

(з. про.) (0,17) (0,09) ? =254,8.

Результат близький до попереднього з дещо більш високою еластичністю. Для обох варіантів були визначені «приватні» регресії для перших 12 і останніх 12 спостережень, і в обох випадках RSSX було більше, ніж RS^,

а відносини RSSX/RSS2, відповідно, становили 1,92 і 2,78. Критичне значення F-статистики при 10 і 10 мірах свободи і рівні значущості в 5% становить 2,98. Таким чином, в обох випадках нульова гіпотеза об гомос- кедастичности не буде отклонена.' Тестові завдання: Банк - це: а) установа, що залучає внески юридичних і:  Тестові завдання: Банк - це: а) установа, що залучає внески юридичних і фізичних осіб; б) кредитна організація, що має виняткове право здійснювати в сукупності наступні банківські операції: залучення у внески грошових коштів фізичних і
Тестові завдання: У єдину банківську систему включені: а) комерційні банки і їх:  Тестові завдання: У єдину банківську систему включені: а) комерційні банки і їх філіали; б) бюджетні і позабюджетні фонди; в) центральний банк; г) все вищеперелічене. Основними функціями банку є: а) регулювання грошового обороту; б) посередництво;
Тестові завдання: Що є основою теорії кредиту: а) розподільна концепція;:  Тестові завдання: Що є основою теорії кредиту: а) розподільна концепція; б) перераспределительная трактування; в) кредитна історія; г) фондова теорія. У кредитній операції об'єктом передачі виступає вартість: а) споживча; б) грошова; в)
Тестові завдання: До кредитних грошей відносяться: а) вексель; б) банкноти; в) чеки; г):  Тестові завдання: До кредитних грошей відносяться: а) вексель; б) банкноти; в) чеки; г) всі варіанти вірні. Особливостями векселя є: а) абстрактність; б) неподільність; в) бесспорность; г) обращаемость; д) тимчасовість. Зобов'язанням банку, відмінним від
Тестові задания:: Рентабельність реалізованої продукції розраховується як:  Тестові задания:: Рентабельність реалізованої продукції розраховується як відношення: А прибутки від виробництва і реалізації продукції до повної собівартості реалізованого продукцииБ прибутку від реалізації продукції до виручки від реалізації продукцииВ балансової
Тест #4. Нові терміни: Як затверджував класик: Мир поважає фахівців, а комп'ютерний мир:  Тест #4. Нові терміни: Як затверджував класик: Мир поважає фахівців, а комп'ютерний мир і поготів... Нові часи зажадали нових понять і термінів. Ви не помітили, що лексика політичних кулуаров нагадує то біржовий жаргон, то сленг нічних клубів? Пам'ятаючи про
Тестіровщик: (Tester) - перевіряє функціональність, якість і ефективність:  Тестіровщик: (Tester) - перевіряє функціональність, якість і ефективність продукту. Будує і виконує тести для кожної фази розвитку проекту.