На головну сторінку   Всі книги

Тест Чоу

Іноді вибірка спостережень складається з двох або більше за подвиборок, і важко встановити, чи потрібно оцінювати одну об'єднану регресію або окремі регресії для кажцой подвиборки. На практиці проблема вибору стоїть звичайно не так жорстко, оскільки можуть бути деякі можливості об'єднання подвиборок при використанні відповідних фіктивних змінних і фіктивних змінних для коефіцієнта нахилу, щоб зробити менш суворим припущення про те, що всі коефіцієнти повинні бути однаковими для кожної подвиборки. До цього питання ми ще повернемося.

Передбачимо, що є вибірка, що складається з двох подвиборок, і що виникає питання, чи потрібно об'єднати їх для оцінювання загальної регресії Р або оцінити окремі регресії А і В. Обозначим суми квадратів залишків для регресій подвиборок UA і Ug. Нехай Uf і і/ - суми квадратів залишків в об'єднаній регресії для спостережень, що відносяться до двом подвиборкам, що розглядається. Оскільки окремі регресії для подвиборок повинні відповідати спостереженням щонайменше так само добре, якщо не краще, ніж об'єднана регресія, то UA lt; Uf і UBlt; Uf. Отже, (UA + UB) lt; Up, де загальна сума квадратів залишків в об'єднаній регресії Up рівна сумі Uf і Uf.

Це пояснюється на мал. 9.6. Передбачимо, що є дані тимчасового ряду по двох змінних і що в період вибірки сталася структурна зміна, що розділяє спостереження на подвиборки А і В. На мал. 9.6 Би регресії для подвиборок забезпечують цілком адекватну відповідність даним, зумовлюючи низькі значення UAu Up Якби було потрібен оцінити об'єднану регресію, як на мал. 9.6 А, то залишки в обох подвиборках загалом були б значно більше.

Рівність між Upn (UA+ UB) буде мати місце тільки при збігу коефіцієнтів регресії для об'єднаної регресії і регресій подвиборок. У загальному випадку при розділенні вибірки буде спостерігатися поліпшення якості рівняння, що можна представити як (Up - UA - UB). Це має свою ціну: використовуються (до+ 1) додаткових мір свободи, оскільки замість (до + 1) параметрів для однієї об'єднаної регресії ми тепер повинні оцінити в сумі (2к + 2) параметрів (до - число пояснюючих змінних, одиниця відповідає постійному члену). Після розділення вибірки, однак, залишається непояснена сума квадратів залишків (UA + UB) і, крім того, (п - 2к~ 2) мір свободи.

А БИ

Тепер ми можемо визначити, чи є значущим поліпшення якості рівняння після розділення вибірки. Для цього використовується /-статистика:

Поліпшення якості рівняння/ Використані міри свободи

непояснена дисперсія / Число мір свободи =

(UP-UA-UB)/(k + 1)

" (UA + UB)/(n-2k-2)' (, що залишаються 9.42)

яка розподілена з (k+ 1) і (п - 2к - 2) мірами свободи.

Тепер, наприклад, давайте повернемося до випадку парної регресної залежності ваги новонароджених від інтенсивності куріння їх матерів, і нехай ми ще не вирішили, чи потрібно об'єднувати подвиборки, що включають 584 матері, які раніше не народжували, і 380 матерів, які раніше народжували. Оцінювання об'єднаної регресії і регресій для подвиборок дає результати, показані в таблиці. Вибірка Оцінене рівняння В2

Сума кеадретое залишків

Об'єднана

вибірка? =3418-7,2* (з. про.) (143) (2,1) 0,012 158,6 х 106 (9.43)

Первістки? =3363-4,0* (з. про.) (18) (2,8) 0,004 91,2 х Ю6 (9.44)

Непереєнци? =3506- 12,1* (з. про.) (23) (3,1) 0,039 63,5 х Ю6 (9.45)

Відповідна /-статистика, отже, рівна:

(158,6-91,2-63,5)/2 F~ (91,2+ 63,5)/960 ~12'1 (9-46)

Критичне значення / з 2 і 960 мірами свободи становить 6,91 (при рівні значущості в 0,1%), тому ми робимо висновок, що не треба оцінювати об'єднану регресію.

Регресії для подвиборок ідентичні регресіям, представленим співвідношеннями (9.36) і (9.37), і цей не простий збіг. У основній регресії

складова, не пов'язана з фіктивною змінною, включає постійний член і показник залежності від інтенсивності куріння. До цього додаються фіктивна змінна, що дозволяє розрізнювати значення постійного члена для первістків і дітей, що народилися не першими, і фіктивна змінна для коефіцієнта нахилу, також що дозволяє розрізнювати коефіцієнти при показнику інтенсивності куріння для двох подвиборок, що розглядаються. Отже, в (9.35) ми не задаємо зазделегідь який-небудь коефіцієнт однаковим для обох подвиборок і, таким чином, дістаємо такі ж оцінки коефіцієнтів, як і в окремих регресіях для подвиборок.

Розглядаючи лише співвідношення (9.35), ми можемо перевірити, чи виправдана ця гнучкість, з'ясувавши, чи вносять вказані фіктивні змінні як група значущий внесок в пояснюючу здатність рівняння. Сума квадратів залишків, якщо фіктивні змінні не включені в рівняння, становить 158,6 х 106, а коли вони включені в рівняння, ця сума рівна 154,7 х 10б. Отже, / "-статистика для перевірки пояснюючої здатності фіктивних змінних як групи має вигляд:

(158,6 -154,7) /2

154,7 / 960 " '9'47gt;

т. е.

вона в точності така ж, як в тесті Чоу.

Можна показати, що це загальний результат. Вибір між використанням розглянутої процедури тесту Чоу або оцінюванням складної регресії з фіктивними змінними на основі співвідношення (9.35) буде залежати від цілей, які ставить перед собою дослідник. Тест Чоу виконується швидше, і він достатній, якщо потрібно тільки встановити, що залежність в подви- борках в деякій мірі розрізнюється. Оцінювання регресії з фіктивними змінними більш інформативно в тому відношенні, що воно дозволяє виконувати /-тести з розглядом внеску кожної фіктивної змінної, а також всієї групи загалом і може привести до компромісу, в якому дослідник передбачає, що деякі коефіцієнти однакові в обох подвиборках, і використовує фіктивні змінні для диференціації значень інших коефіцієнтів.

Вправи

Виконайте тест Чоу, щоб визначити, чи мав місце структурний розрив залежності витрат на автомобілі від особистого доходу, що розташовується в 1973 р., використовуючи дані табл. 9.2.

Дослідник, що цікавиться впливом особливостей національної культури на структуру споживання, пропонує 20 малайським, 20 китайським, 20 індійським і 20 іншим сім'ям, мешкаючим в Куала-Лумпуре, детально записувати свої витрати на продукти харчування протягом одного року. Стисло опишіть переваги і нестачі оцінювання однієї функції попиту, описаної рівнянням з фіктивними змінними, для всіх 80 сімей в порівнянні з оцінюванням чотирьох окремих рівнянь для різних етнічних груп.

Додаток 9.1

Якісні залежні змінні

Може трапитися так, що змінна, детермінанти якої потрібно дослідити, є якісною по своєму характеру. Наприклад, в нашому дослідженні в області акушерства можна розглянути питання оцінки чинників, що приводять в критичних обставинах до необхідності родоразреше- ния шляхом кесарів перетину. Наша мета полягає в зменшенні частоти проведення такої операції, що важливо саме по собі і для зниження витрат на спеціальне обладнання для догляду за немовлятами і т. д.

Спрощений спосіб розгляду цієї проблеми полягає у визначенні залежної змінної emsec як фіктивній змінній і в оцінюванні регресії звичайним способом. Наприклад, ми можемо вважати emsec рівній одиниці, якщо родоразрешение проводилося шляхом кесарів перетину, і рівної нулю, коли роди були нормальними. Використовуючи дані про 964 роди, ми отримуємо наступний результат:

етamp; з = 0,08 - 0,08/) + 0,01 old + 6,61 short + 0,05heavy -

- 0,02 class + 0,01 UM+ 0,0018 х, (9.48)

де D - фіктивна змінна числа родів в минулому (значення 1 - якщо мати народжувала раніше, значення 0 - в інших випадках); old - фіктивна змінна віку (1 - коли матері 36 або більше за років, 0 - в інших випадках); short - фіктивна змінна зростання матері (1 - якщо мати знаходиться в нижчому квинтиле по зростанню, т. е. має зростання 157 см або менше, 0 - в інших випадках); heavy - фіктивна змінна ваги матері (1 - якщо мати відноситься до верхньому квинтилю по вазі, т. е. має вагу 68 кг або більше, 0 - в інших випадках); class - фіктивна змінна відвідування занять по передродовій підготовці (1 - якщо мати регулярно відвідувала ці заняття, 0 - в інших випадках); UM - фіктивна змінна сімейного стану (1 - якщо мати є самотньою, 0 - в іншому випадку); х - кількість сигарет, що викурюються в день в період вагітності.

Останні три змінні представляють інтерес для соціальної політики; інші включені в рівняння, тому що, як відомо, вони стосуються частоти проведення операції кесарів перетину, і якщо вони не будуть включені, це може привести до зміщення оцінок коефіцієнтів регресії.

Значення, що Прогнозується emsec для будь-якого спостереження показує імовірність родоразрешения шляхом кесарів перетину, якщо дані значення параметрів в правій частині рівняння. Коефіцієнт при кожній змінній збільшує імовірність кесарів перетину для матері з відповідним параметром. Наприклад, ця імовірність на 8% нижче для матерів, які народжували раніше, в порівнянні з матерями, які раніше не народжували.

Нестачі лінійної ймовірностний моделі, як відомо, пов'язані з тим, що її випадковий член не задовольняє звичайним припущенням. Зокрема, він не розподілений нормально, тому не можна виконати звичайну перевірку значущості. Крім того, він може привести до появи значень залежної змінної, що прогнозуються більше одиниці або менше нуля, що неможливо.

Для подолання цих труднощів розроблено декілька статистичних методів, аналогічних методам побудови лінійної ймовірностний моделі, але заснованих на інших принципах. Можливо, найбільш широко відомим з них є логит-аналіз, заснований на методі максимальної правдоподібності. Розгляд цього методу виходить за рамки даної книги, і досить відмітити, що його можливе використання на практиці багато в чому Співпадає з практичним застосуванням регресного аналізу.

У прикладі, що розглядається логит-аналіз дає наступний результат (в дужках приведені /-статистики):

етamp; з = Константа - 0,11 D + 0,1 lold + 0,05short + 0,05heavy -

( (-4,61) (3,46) (2,45) (2,27)

- 0,02 з/lt; ш + 0,01 UM + 0,0025х (9.49)

(- 1,09) (0,33) (1,26)

(постійний член не був обчислений за допомогою використаного алгоритму). Рівняння показує значущі впливи перших чотирьох змінних, як це і очікувалося, але не показує значущого впливу соціальних змінних.

10 Тестові завдання: Міжнародні розрахунки - це: а) розрахунки між різними:  Тестові завдання: Міжнародні розрахунки - це: а) розрахунки між різними країнами; I 164 би) розрахунки по зовнішній торгівлі товарами і послугами, по некомерційних операціях, будівництві і наданні міжнародною допомоги різними підприємствами; в)
Тестові завдання: Грошова система, заснована на використанні двох металів в:  Тестові завдання: Грошова система, заснована на використанні двох металів як гроші, - це: а) дуалізм; б) біметалізм; в) двійчастий монометалізм; г) параллелизм. Золотослитковий стандарт характеризується тим, що: а) банкноти обмінюються на золоті злитки
Тестові задания:: Пряме фінансування - це: А зниження налоговБ. емісія:  Тестові задания:: Пряме фінансування - це: А зниження налоговБ. емісія корпоративних облигацийВ. економія фонду оплати трудаГ. емісія акцийД. нарахування амортизацииОтвет: Би, Г. Косвенноє фінансування - це: фінансування шляхом випуску акцій і облігацій
Тестові задания:: Оборотні кошти - це А грошові кошти, що авансуються в:  Тестові задания:: Оборотні кошти - це А грошові кошти, що авансуються в оборотні виробничі фонди і фонди обращенияБ грошові кошти, що авансуються в основні фонди і товарні запасиВ фінансові ресурси, що направляються на поточні витрати і
Тест #4. Нові терміни: Як затверджував класик: Мир поважає фахівців, а комп'ютерний мир:  Тест #4. Нові терміни: Як затверджував класик: Мир поважає фахівців, а комп'ютерний мир і поготів... Нові часи зажадали нових понять і термінів. Ви не помітили, що лексика політичних кулуаров нагадує то біржовий жаргон, то сленг нічних клубів? Пам'ятаючи про
Тест «Випробувальний термін»: Перевірте, чи використовуєте Ви наступні кошти і заходи в:  Тест «Випробувальний термін»: Перевірте, чи використовуєте Ви наступні кошти і заходи в період випробувального терміну і введення кандидатів в посаду. Питання Так Немає 1. Чи Повідомлена дата початку роботи, час явки на прийом до вказаної особи? 2. Перевірка оформлення особистого
Тестування правильності специфікації регресної моделі:  Тестування правильності специфікації регресної моделі: Якщо помилка має ненульове мат. очікування, то оцінки ОМНК виявляться зміщеними. Іншими словами, в помилці залишилася детермінований (невипадкова) складова, яка може бути функцією вхідних в модельрегрессоров, що і означає, що функ- - -