На головну сторінку   Всі книги

F-тест на якість оцінювання

Навіть якщо між у і х відсутній залежність, по будь-якій даній вибірці спостережень може показатися, що така залежність існує, можливо і слаба. Тільки по випадковому збігу обставин вибіркова ковариация буде в точності рівна нулю.

Отже, тільки чисто випадково коефіцієнт кореляції і коефіцієнт R2 будуть в точності рівні нулю.

Це представляє для нас проблему. Як взнати, чи дійсно отримане при оцінці регресії значення коефіцієнта R2 відображає істинну залежність або воно з'явилося випадково?

У принципі можна було б прийняти наступну процедуру. Сформулюємо як нульова гіпотеза твердження, що зв'язок між у їх відсутній, і знайдемо значення коефіцієнта, яке може бути перевищене в 5% випадків. Потім використовуємо цю цифру як критичне значення для перевірки гіпотези при 5-процентному рівні значущості. Якщо цей рівень перевищується, то ми відхиляємо нульову гіпотезу. Якщо він не перевищений, то ця гіпотеза приймається.

Така перевірка, подібно /-тесту для коефіцієнта регресії, не служить доказом. Дійсно, при 5-процентному рівні значущості є ризик допущення помилки I роду (відхилення нульової гіпотези, коли вона істинна) в 5% випадків, але можна, звісно, знизити цей ризик за рахунок використання більш високого рівня значущості, наприклад в 1%. Тоді критичне значення може бути випадково перевищене тільки в 1 % випадків, тому воно вище критичного значення для перевірки гіпотези при 5-про- центном рівні значущості.

Яким чином можна визначити критичне значення коефіцієнта R2 при будь-якому рівні значущості? Тут виникає невелика проблема. У нас немає таблиці критичних значень коефіцієнта R2. Традиційна процедура складається у використанні непрямого підходу і виконання так званого F-тесту, заснованого на аналізі дисперсії (теорія, лежача в основі цього підходу, описується в роботі А. Мула і Ф. Грейбілла [Mood, Graybill, 1963]).

Передбачимо, що, як і раніше, можна розікласти дисперсію залежної змінної на «пояснену» і «непояснену» складові, скориставшись рівнянням (2.45):

Var (у) = Var (у) + Var (е). (3.56)

Використовуючи визначення вибіркової дисперсії і помноживши на п обидві частини рівняння (3.56), можна представити його таким чином:

10gt;-у)2=1(у-у)2 + 1е2. (3.57)

(Нагадаємо, що е = 0 і вибіркове середнє значення р дорівнює вибірковому середньому у.)

Ліва частина рівняння являє собою обшую суму квадратів відхилень (TSS) залежної змінної від її вибіркового середнього значення. Перший член в правій частині рівняння є поясненою сумою квадратів (ESS), а другий член - непоясненою сумою квадратів відхилень (RSS), який може бути просто названий S:

TSS = ESS + RSS. (3.58)

F-статистика для перевірки якості оцінювання регресії записується як відношення поясненої суми квадратів (з розрахунку на одну незалежну змінну до залишкової суми квадратів) з розрахунку на одну міру свободи:

ESS

F =

RSS - (3.59)

n-k-l

де k - число незалежних змінних.

Після ділення на TSS чисельника і знаменника співвідношення (3.59) F-статистика може бути еквівалентно виражена на основі коефіцієнта R2:

(ESS /TSS)/до _ R2 / до (RSS/TSS)/(n-k-l) (I - R2) / (n - до ~l) (360)

В даному контексті k = 1 і, таким чином, рівняння (3.60) приймає вигляд:

F ~ (\-R2)/(n-2)' (3-61)

Після обчислення критерію F по значенню коефіцієнта R2 ви відшукуєте величину FKpum - критичне значення Fв відповідній таблиці.)(

Якщо F gt;)( F т, то ви відхиляєте нульову гіпотезу і робите висновок про те, що пояснення» поведінки величини, що є «у краще, ніж можна було б отримати чисто^ випадково.)(

В табл. А. З представлені критичні значення Fnpn рівнях значущості в 5 і 1%.)( В кожному випадку критичне значення залежить від числа незалежних змінних до, яке знаходиться у верхньому рядку таблиці, і від числа мір свободи (п - до - 1), яке включене в її крайній лівий стовпець.)( В даному контексті розглядається випадок парної регресії, коли до = 1, і ми повинні використати першу колонку таблиці.)(

В прикладі з витратами на живлення коефіцієнт/?)(2 становив 0,9775.)( Оскільки було 25 спостережень, F-статистика дорівнює:)(

R2 / {(1 - R2) / 23} = 0,9775 / (0,0225 / 23) = 999,2.)(

При однопроцентном рівні значущості критичне значення критерію F (перша колонка, ряд 23) становить 7,88.)( Тому в даному конкретному прикладі у нас не залишається ніяких сумнівів відносно того, що нульову гіпотезу потрібно відхилити.)( Іншими словами, отримане значення коефіцієнта R2 так високе, що ми відхиляємо припущення про те, що воно могло з'явитися випадково.)( На практиці F-статистика завжди обчислюється разом з коефіцієнтом R2, тому немає необхідності використати рівняння (3.60).

Які ж проблеми виникають при використанні цього непрямого підходу? Чому б не мати таблицю критичних значень коефіцієнта Л2? Відповідь полягає в тому, що таблиця значень критерію? є корисною для багатьох способів перевірки дисперсії, одним з яких виступає розрахунок коефіцієнта R2. Замість спеціалізованої таблиці для кожного конкретного випадку набагато зручніше (або, щонайменше, економнее) мати одну узагальнену таблицю, роблячи при необхідності перетворення типу (3.60).

Звісно, при необхідності можна вивести і критичні значення R2. Критичне значення R2 пов'язане з критичним значенням? наступним рівнянням:

lt;3-62)

Л2кріт / до

з якого слідує, що

"2 - kFKpUm

lt;3-63gt;

У прикладі з витратами на живлення критичне значення? при рівні значущості в 1% становило 7,88. Отже, в цьому випадку при до = 1

R2, cpum = im= °'26' (3'64)

В нашому прикладі величина R2 набагато вище за 0,26, тому безпосереднє порівняння величини R2 з його критичним значенням підтверджує висновок про те, що в результаті? -тесту ми повинні відхилити нульову гіпотезу.

Вправи

У вправі 3.12 значення коефіцієнта Л2 в моделі регресії між витратами на комунальні послуги і особистим доходом, що розташовується становило (з точністю до чотирьох десятеричних розрядів) 0,9875. Обчисліть відповідну? -статистику і перевірте, що вона рівна 1814,7, т. е. результату, виданому комп'ютером. Виконайте? -тест при рівнях значущості в 5 і 1%. Чи Є необхідність представляти результати перевірки на обох рівнях?

Аналогічним образом, використовуючи результат вправи 2.4, обчисліть? -статистику на основі значення коефіцієнта R2 і перевірте, що вона не суперечить розрахункам, виконаним на комп'ютері. Проведіть відповідний? - тест. 6.3. Тест по темі «Страхування»: 1. Найбільш поширеним способом зниження фінансового ризику:  6.3. Тест по темі «Страхування»: 1. Найбільш поширеним способом зниження фінансового ризику є: а) диверсифікація; б) страхування; в) придбання додаткової інформації про вибір і результати. 2. Страхове забезпечення застосовується: а) в майновому страхуванні; б)
ТЕСТ 2 РОЗДІЛ 2. ОСОБЛИВА ЧАСТИНА: № 1 Якщо клієнт уклав терміновий договір банківського внеску з:  ТЕСТ 2 РОЗДІЛ 2. ОСОБЛИВА ЧАСТИНА: № 1 Якщо клієнт уклав терміновий договір банківського внеску з банком: Він має право в будь-який час розірвати даний договір і отримати відсотки по ньому Взагалі не має право розірвати даний договір до закінчення його терміну Він має право в будь-який час
Тест «Професійна дезадаптация»: Ввідні зауваження. Рівновага між людиною і професійної:  Тест «Професійна дезадаптация»: Ввідні зауваження. Рівновага між людиною і професійною середою, досягнута в процесі професійної адаптації, не являє собою статичного, раз і назавжди досягнутого стану. Зміна професійної середи, пов'язана,
ТЕСТОВІ ЗАВДАННЯ: Перед виконанням тестових завдань необхідно ознайомитися з кон:  ТЕСТОВІ ЗАВДАННЯ: Перед виконанням тестових завдань необхідно ознайомитися з кон спектом лекцій і рекомендованою літературою. Тема 1. Поняття і предмет римського приватного права 1. Публічне право охороняло a) інтереси громадських організацій b) інтереси народів,
Тестові завдання: 1. Що таке фінанси: а) грошові кошти, обслуговуючі рух:  Тестові завдання: 1. Що таке фінанси: а) грошові кошти, обслуговуючі рух товарів і послуг; б) економічні відносини, виникаючі з приводу формування і розподілу фондів грошових коштів; в) грошові кошти, що знаходяться в розпорядженні держави.
Тестові завдання: Перші банки виникли на основі: а) міняльної справи; б) монетного:  Тестові завдання: Перші банки виникли на основі: а) міняльної справи; б) монетної справи; в) лихварства; г) інакше. 235 I Встановите відповідність: а) 1-й етап 1) формування повноцінної банківської системи, поява центральних банків;
Тестові задания:: Показник фінансового важеля (левереджа) визначає А співвідношення:  Тестові задания:: Показник фінансового важеля (левереджа) визначає А співвідношення балансової і чистої прибилиБ частку обов'язкових твердих платежів в складі чистої прибилиВ співвідношення чистого прибутку з її сумою, зменшеною на величину обов'язкових твердих