На головну сторінку   Всі книги

Тест Колмогорова-Смирнова (ДО-З)

Хи-квадрат тест, без сумніву, є найбільш популярним з всіх методів порівняння двох розподілів. Оскільки багато які орієнтовані на ринок додатки, крім тих, що розглядаються в цьому розділі, часто використовують хи-квадрат тест, то він описаний в Пріложенії А.

Однак для наших цілей найкращим методом буде тест До-З. Цей дуже ефективний тест застосуємо до некомірчастих розподілів, які є функцією однієї незалежної змінної (в нашому випадку, прибуток за одну операцію).

Всі функції розподілу імовірності мають мінімальне значення 0 і максимальне значення 1. Те, як вони поводяться між ними, і відрізняє їх. Тест До-З вимірює дуже просту змінну D, яка визначається як максимальне абсолютне значення різниці між двома функціями розподілу імовірності. Тест До-З досить простий. N об'єктів (у нашому разі операцій) нормуються (віднімається середнє значення, і отримана різниця ділиться на стандартне відхилення) і сортуються в порядку зростання. Коли ми проходимо ці відсортовані і нормовані операції, накопичена імовірність кількості операцій, що розглядається ділиться на N. Когда ми беремо першу операцію у відсортованій послідовності з найменшим стандартним значенням, функція розподілу імовірності (cumulative density function, далі - ФРВ) рівна 1/N. Для кожних стандартних значення, які ми проходимо, наближаючись до найбільшого стандартного значення, до чисельника додається одиниця. У кінці послідовності наша ФРВ буду рівна N/N, або 1. Для кожного стандартного значення ми можемо розрахувати теоретичний розподіл. Таким чином, ми можемо порівняти фактичну функцію розподілу імовірності з будь-якою теоретичною функцією розподілу імовірності. Змінна D, або статистика До-З (ДО-З statistic), рівна найбільшій відстані між значенням нашої фактичної функції розподілу імовірності і значенням теоретичного розподілу ФРВ при цьому ж стандартному значенні. При порівнянні фактичної ФРВ для даного стандартного значення з теоретичної ФРВ для цього ж стандартного значення ми повинні також порівняти теоретичну ФРВ попереднього стандартного значення з фактичної ФРВ поточного стандартного значення.

Для того щоб прояснити цю ситуацію, подивимося на малюнок 4-1. Відмітьте. що в точці А фактична крива знаходиться вище теоретичної. Тому ми порівнюємо поточне значення фактичної ФРВ з поточним теоретичним значенням для знаходження найбільшої різниці. Однак в точці В фактична крива знаходиться нижче теоретичної. Тому ми порівнюємо попереднє фактичне значення з поточним теоретичним значенням. Ідея складається в тому, що в результаті ми виберемо найбільшу різницю.

Для кожного стандартного значення нам треба взяти абсолютне значення різниці між поточним значенням фактичної ФРВ і поточним значенням теоретичної ФРВ.

Нам також треба взяти абсолютне значення різниці між попереднім

значенням фактичної ФРВ і поточним значенням теоретичної ФРВ. Повторивши цю операцію для всіх стандартних значень точок, де фактична ФРВ робить стрибок вгору на 1/До і взявши найбільшу різницю, ми визначимо змінну Б. Накопленная імовірність

Малюнок 4-1 Тест До-З

Стандартне значення

Чим нижче значення Би, тим більше схожі два розподіли. Ми можемо перетворити значення Би в рівень значущості за допомогою наступної формули:

(4.01) 8Ю= X * 4-2 * ЕХР (-2 * ІА 2 * (14 А (1/2) * БИ) Л 2),

де БЮ = рівень значущості для даного Би і До; Би = статистика До-З;

N = кількість операцій, по яких визначена статистика До-З;

% = оператор, що означає залишок після ділення. Тут 1%2 дає залишок після ділення I на 2;

ЕХР () = експонентна функція.

Немає необхідності підсумовувати значення I від 1 до нескінченності. Рівняння сходиться (звичайно дуже швидко) до певного значення. Після того як межа досягнуть (згідно з допуском, встановленим користувачем), немає необхідності продовжувати підсумовування значень.

Розглянемо рівняння (4.01) на прикладі. Допустимо, у нас є 100 операцій, а значення статистики До-З дорівнює 0,04:

11 = (1 % 2) * 4 - 2 * ЕХР (-2 * 1Л2 * (100л (1/2) * 0,04) л 2) =1*4-2* ЕХР (-2 * Л 2 * (10 * 0,04) л 2) = 2 * ЕХР (-2 * 1Л2 * 0, л 2) = 2*ЕХР (-2*1*0,16) = 2 * ЕХР (-0,32) = 2 * 0,726149 = 1,452298

Таким чином, нашим першим значенням є 1,452298. Тепер додамо наступне значення:

12 = (2 % 2) * 4 - 2 * ЕХР (-2 * 2Л 2 * (100л (1/2) * 0,04) л2) =0*4-2* ЕХР (-2 * 2Л 2 * (10 * 0,04) л 2) = -2 * ЕХР (-2 * 2л 2 * 0,4л 2) = -2*ЕХР (-2*4*0,16) = -2*ЕХР (-1,28) = -2 * 0,2780373 = -0,5560746

Додавши -0,5560746 до нашої поточної суми 1,452298, ми отримаємо нову поточну суму 0,8962234. Потім знов збільшимо I на 1, тепер воно буде таке, що дорівнює 3, і вирішимо рівняння. Значення, що Вийшло додамо до поточної суми 0,8962234. Потрібно поступати таким чином і далі, поки поточна сума в межах допуску не перестане змінюватися. У нашому прикладі граничне значення буде таке, що дорівнює 0,997. Ця відповідь означає, що при 100 операціях і значенні статистики До-З 0,04 ми можемо бути упевнені на 99,7%, що фактичний розподіл генерировано функцією теоретичного розподілу. Іншими словами, ми можемо бути на 99,7% упевнені, що функція теоретичного розподілу представляє фактичний розподіл. У цьому випадку це дуже хороший рівень значущості. Тест: «Ваші здібності як керівника»: Керівник, приймаючи управлінське рішення, повинен уміти вплинути:  Тест: «Ваші здібності як керівника»: Керівник, приймаючи управлінське рішення, повинен уміти вплинути на підлеглих з тим, щоб переконати їх в правильності рішення, заручитися підтримкою, що забезпечить якісне виконання рішення. Перевірте наявність у вас такої
Тест на реальність і робота з контраргументами: Корисно і доцільно погодити історію, що пропонується з позицією:  Тест на реальність і робота з контраргументами: Корисно і доцільно погодити історію, що пропонується з позицією іншої сторони, а іноді і інших учасників. Але в цьому випадку погодити не значить погоджуватися, приймати ці позиції. Позиція сторони завжди буде відрізнятися, але не враховувати
Тест ранговой кореляції Спірмена: При виконанні тесту ранговой кореляції Спірмена передбачається, що:  Тест ранговой кореляції Спірмена: При виконанні тесту ранговой кореляції Спірмена передбачається, що дисперсія випадкового члена буде або збільшуватися, або меншати по мірі збільшення х, і тому в регресії, що оцінюється з допомогою МНК, абсолютні величини залишків і
Тестові завдання по дисципліні Земельні спори: Земельна суперечка: A. спор про право на земельну дільницю B. про відмову в:  Тестові завдання по дисципліні Земельні спори: Земельна суперечка: A. спор про право на земельну дільницю B. про відмову в наданні для до/ф х. C. тимчасовому вилученні з/у D. невчасному внесенні платежів за з/у E. спори, пов'язані з охороною земель F. відмова в реєстрації з/ч Вимоги до
Тестові завдання: 1. Які ланки фінансової системи відносяться до загальнодержавних:  Тестові завдання: 1. Які ланки фінансової системи відносяться до загальнодержавних (централізованим) фінансів? а) фінанси господарюючих суб'єктів; б) державний бюджет; в) фінанси освіти; г) державний кредит. 2. Які фінансові плани
Тестові завдання: У єдину банківську систему включені: а) комерційні банки і їх:  Тестові завдання: У єдину банківську систему включені: а) комерційні банки і їх філіали; б) бюджетні і позабюджетні фонди; в) центральний банк; г) все вищеперелічене. Основними функціями банку є: а) регулювання грошового обороту; б) посередництво;
Тестові завдання: До кредитних грошей відносяться: а) вексель; б) банкноти; в) чеки; г):  Тестові завдання: До кредитних грошей відносяться: а) вексель; б) банкноти; в) чеки; г) всі варіанти вірні. Особливостями векселя є: а) абстрактність; б) неподільність; в) бесспорность; г) обращаемость; д) тимчасовість. Зобов'язанням банку, відмінним від