опомогою датчика випадкових чисел сформувати з неї будь-яке число розмножених вибірок. Процедура, хоча й нереальна без ЕОМ, проста з погляду програмування. У порівнянні з описаною вище процедурою з'являються нові недоліки - неминучі збіги елементів розмножених вибірок і залежність від якості датчиків псевдовипадкових чисел. Однак існує математична теорія, що дозволяє (при деяких припущеннях і безмежному зростанні обсягу вибірки) обгрунтувати процедури бутстрепа.
Є багато способів розвитку ідеї розмноження вибірок. Можна по вихідної вибірці побудувати емпіричну функцію розподілу, а потім якимось чином від кусочно-постійної функції перейти до безперервної функції розподілу, наприклад, з'єднавши точки відрізками прямих. Інший варіант - перейти до безперервного розподілу, побудувавши непараметричних оцінку щільності. Після цього рекомендується брати розмноження вибірки з цього неперервного розподілу (що є спроможною оцінкою вихідного), безперервність захистить від збігів елементів у цих вибірках.
Інший варіант побудови розмножених вибірок - більш прямий. Вихідні дані не можуть бути визначені абсолютно точно і однозначно. Тому пропонується до вихідних даних додавати малі незалежні однаково розподілені похибки. При такому підході одночасно з'єднуємо разом ідеї стійкості і бутстрепа. При уважному аналізі багато ідей економетрики тісно один з одним пов'язані.
У яких випадках доцільно застосовувати бутстреп, а в яких - інші статистичні методи? У період рекламної кампанії зустрічалися, у тому числі в науково-популярних журналах, твердження про те, що і для оцінювання математичного очікування корисний бутстреп. Однак це не так. При зростанні числа випробувань методом Монте-Карло бутстреп-оцінка наближається до класичної оцінці - середньому арифметичному результатів спостережень. Іншими словами, бутстреп-оцінка відрізняється від класичної тільки шумом псевдовипадкових чисел.
Аналогічною є ситуація і в ряді інших випадків. Там, де статистика добре розвинена, де знайдені методи аналізу даних, у тому чи іншою сенсі близькі до оптимальних, Бутстреп робити нічого. А от у нових областях зі складними алгоритмами, властивості яких недостатньо ясні, він являє собою цінний інструмент для вивчення ситуації. [2]
2.1 Основні поняття та способи обчислення оцінок
Нехай дана незалежна повторна вибірка обсягу п з невідомого розподілу F, по якій оцінюється значення невідомого функціоналу (параметра) (F). Припустимо, що для цієї мети використовується статистика і нас цікавить міра похибки цієї статистики. На практиці використовують такі заходи похибки, як зміщення
Вп=Вп (F)=EF - (F), (2.1.1)
дисперсію
Dn=Dn (F)=EF (- EF) 2, (2.1.2)
стандартне відхилення
Sn=Sn (F) =, (2.1.З)
квадратичний ризик
Qn=Qn (F)=EF (- (F)) 2 (2.1.4)
і деякі інші. Всі ці заходи похибки, як правило, виявляються функціоналами від невідомого точного розподілу статистики:
G (х)=Gn (F, х)=PF {}. (2.1.5)
Символи РF і ЕF тут і далі вказують на ймовірності та математичні очікування, обчислювані в припущенні, що вихідна вибірка витягнута з розподілу F. Те, що ця залежність істотна, можна зрозуміти, розглядаючи наступний приклад. Нехай=ЕF X - математичне очікування дійсної випадкової величини X, що підкоряється розподілу F; Хп - вибірка обсягу п з цього розподілу, - вибіркове середнє. Тоді,
Dn=Qn=n - 1DFX
де DFX=dF (x) - дисперсія випадкової величини X. При великих п відповідно до центральною граничною теоремою можна використовувати наближена рівність
F, (x/[DFX] 1/2) (2.1.6)
де Ф - функція розподілу стандартної нормальної випадкової величини N (0,1), т.е.
(2.1.7)
Сутність бутстрепа полягає в наступному: для оцінки тієї чи іншої міри точності статистики (щодо невідомого істинного значення) розглянемо оцінку істинного розподілу F по Хп. У параметричному випадку, коли сімейство F є конечномірні, тобто , Де Н - відкрите підмножина k-мірного евклідового простору Rk, при виконанні деяких аналітичних припущень (типу умов Крамера - Рао, що забезпечують хороші властивості оцінок максимальної правдоподібності вектора), оцінка - це. У непараметричної ситуації, коли F - майже повністю невідоме розподіл, в ролі виступає емпіричне розподіл, що приписують вес 1/n кожному спостереженню Xi, i=1,2, ..., п. Вибравши відповідну типу завдання оцінку, розглянемо умовно незалежні (при заданих X1, ..., Хп) випадкові величини підкоряються розподілу, тобто спільне умовний розподіл має вигляд
(2.1.8)
Сукупність називається бутстреп-вибіркою обсягу n. Значення - це бутстреп-реалізація або бутстреп-повторення стати...