гий час відігравало другорядну роль в теоретичних дослідженнях. Справа в тому, що при точно відомому розподілі статистики або інший монотонної по функції, коли цей розподіл не залежить від істинного розподілу вибірки, нескладно побудувати точний довірчий інтервал для. Наприклад, якщо статистика підпорядковується нормальному розподілу з відомою дисперсією, то центральний довірчий інтервал для має вигляд
,
де - -квантіль розподілу N (0, 1);. Такий довірчий інтервал називають центральним, бо обидві «хвостові» ймовірності і рівні. Здається, що для асимптотично нормальних статистик при
(2.3.1)
можна будувати наближені довірчі інтервали, користуючись оцінками граничної дисперсії. Це призводить до так званих стандартним інтервалам з межами
(2.3.2)
Ефрон навів низку прикладів, коли стандартні інтервали незадовільні. Це зрозуміло, адже вони засновані на не ефективному виборі оцінки функції розподілу статистики
, а саме, на оцінці виду де - оцінка граничного стандартного відхилення.
Для усунення недоліків стандартних інтервалів Ефрон запропонував використовувати бутстреп. Він рекомендує, наприклад, будувати наближений довірчий інтервал на основі процентилей (або процентних точок) бутстреп-оцінки функції розподілу. Це означає, що з вихідної вибірки витягується бутстреп-вибірка за якою визначається бутстреп-реалізація статистики. Проводячи цей процес велике число М раз, ми отримуємо значення, по яких і будується бустреп-оцінка функції розподілу виду
.
Квантилі розподілу, тобто рішення рівнянь; і пропонується застосовувати в якості наближених кордонів довірчий інтервал рівня, це так званий Процентільние інтервал. Якщо статистика має в точності нормальний розподіл, то ефективніше оцінювати за допомогою, де, - оцінки,.
Таким чином, стандартний інтервал - це окремий випадок Процентільние інтервалу. По суті, подібні способи довірчого оцінювання застосовував ще Фішер при побудові довірчих інтервалів для кореляції двовимірної нормальної вибірки. Нехай -емпіріческій коефіцієнт кореляції,, (перетворення Фішера). Тоді розподіл статистики добре апроксимується нормальним розподілом, тобто ймовірність майже збігається з. Тому Процентільние інтервал для можна отримати, застосувавши зворотне перетворення до стандартного інтервалу для.
Ефрон дав загальне умова застосовності Процентільние інтервалу, яке полягає в тому, що оцінює статистика може бути перетворена до нормально розподіленої статистикою, тобто, якщо знайдуться монотонні перетворення,, так що статистика підпорядковується нормальному розподілу, то можна використовувати Процентільние метод. При цьому не обов'язково знати вид перетворень g, h і значення константи - це не використовується при побудові Процентільние інтервалу. Процедура Процентільние методу інваріантна щодо монотонних замін шкал,, т.е.
. (2.3.3)
Тут - довірча межа Процентільние методу:
. (2.3.4)
У складних ситуаціях і Процентільние метод можна поліпшити за рахунок відомої в аналізі даних процедури корекції зсуву. Справа в тому, що хороші властивості Процентільние інтервалу пояснюються збігом медіани бутстреп-розподілу статистики і самої величини, тобто. Коли це не так, Процентільние інтервал може мати помітний зсув щодо точного довірчого інтервалу. Корекція зміщення проводиться за допомогою величини
. (2.3.5)
Це призводить до так званих НД-інтервалам, або Процентільние інтервалам з корекцією зміщення, межі яких визначаються формулою
. (2.3.6)
Ефрон запропонував подальший розвиток НД-методу, так званий НД? -метод. Константа «прискорення»? (насправді? виявляється функціоналом від розподілу статистики) виражається формулою
. (2.3.7)
Тут -так звана емпірична функція впливу, a - вироджені розподіл ймовірностей, зосереджене в точці х. Назва «емпірична функція впливу» викликано формальним схожістю з «теоретичної» функцією впливу [17]. Довірчі границі для по НД? -методів Мають вигляд
, (2.3.8)
так що при?=0 отримаємо ті ж межі, що і при НД-методі.
Ефрон обґрунтовує бутстреп-методи довірчого оцінювання лише в порівняно простих ситуаціях (коли статистика підпорядковується розподілу, так що бутстреп-розподіл - це), висловлюючи надію, що подальший розвиток асимптотичної теорії дозволить обгрунтувати ці методи для широкого класу задач. [14]
.4 Побудова довірчих інтервалів
Відповідь на запитання, які статистики краще використовувати при побудові довірчих інтервалів за допомогою бутстрепа, криється в двох простих міркуваннях. По-перше, бутстреповское розподіл центровано не біля істинного...