авити кожну бутстреп-реалізацію. Та й програмно це реалізувати набагато простіше.
Звернемося тепер до незвичайного назвою цього методу. Слово «bootstrap» утворене з двох іменників «boot» і «strap». Кожне з них багатозначне. Наведемо деякі їх значення. Для першого: черевик, стусан ногою, колодка (знаряддя тортур), новобранець (у флоті), контейнер і т.д. Для другого: ремінь, ремінець, смуг?? а матерії або металу, зав'язка, липкий пластир, лямка, скоба, хомут, сережка, кредит, порка ременем. Поєднання цих слів дає значення: шкіряна смужка, що прикріплюється петлею до задника похідного черевика для полегшення його натягування на ногу. Такі черевики увійшли в моду в Англії в 30-ті роки XIX ст. Мабуть, тоді ж з'явилася і приказка: «Lift oneself by the bootstrap». Ця приказка означає: «вибитися в люди завдяки власним зусиллям», «Самому пробити собі дорогу». Бутстреп-процедур а не вимагає інформації про вид закону розподілу досліджуваної випадкової величини і в цьому сенсі може розглядатися як непараметрическая, тобто вона працює без опори на істотну частину апріорної інформації, ніж, мабуть, і обумовлений такий вибір терміна.
Перше застосування терміна «бутстреп» відноситься, мабуть, до кінця 50-х років. Уже в перших поколіннях ЕОМ виникла завдання здійснення початкового завантаження - «введення програми, що дозволяє машині здійснити введення». Це робилося за допомогою так званої нуль-програми. По-русски термін перекладався словом «розкрутка». У деяких операційних системах ЕОМ третього покоління є навіть команди початкового завантаження BOOT (скорочення від «boot-strap», наприклад в ОС РАФОС для ЕОМ СМ - 4 або в близьких до неї PDP - 11 (операційна система RT - 11). Пізніше значення терміна розширилося. Він трактується так: «Bootstrap - самообеспечиваться. Відноситься до методу або пристрою, що володіє здатністю приводити себе в потрібне стан за допомогою своїх власних дій ...». Цікаво, що Англо-російський словник математичних термінів (М .: ІЛ, 1962 ) наводить ще одне значення, пов'язане з обчислювальною технікою: «bootstrap integrator - інтегратор з параметричної компенсацією похибок». [1]
Розглянемо задачу з приладами втретє для підтвердження ефективності методу «бутстреп». Нагадаємо, наша вибірка:
X=85, 105, 115, 110, 125, 125, 130;
Для розрахунків використовуємо програму matlab, оскільки алгоритм методу вже включений до її складу. Так як кількість бутстреп-вибірок залежить від «примхи» дослідника, зупинимося на n=5000. Синтаксис виглядає наступним чином:
Xboot=bootstrp (nboot, function, argument)
Стосовно до нашого нагоди:
Xboot=bootstrp (5000,median, X)
Неважко порахувати середнє значення Xboot, яке становить:
Xboot ср=116,11
Вибіркове зміщення ж, при цьому,?=7,63.
2. Математичні основи методу
У чому основна ідея групи методів розмноження вибірок raquo ;, найбільш відомим представником яких є бутстреп?
Нехай дана вибірка. У ймовірносно-статистичної теорії припускаємо, що це - набір незалежних однаково розподілених випадкових величин. Нехай економетрика цікавить деяка статистика Як вивчити її властивості? Ідея, яку запропонував в 1949 р М. Кенуй (це і є метод складного ножа ) полягає в тому, щоб з однієї вибірки зробити багато, виключаючи по одному спостереженню (і повертаючи раніше виключені). Перерахуємо вибірки, які виходять з вихідної:
;
;
;
Всього n нових (розмножених) вибірок обсягом (n - 1) кожна. По кожній з них можна розрахувати значення цікавить статистики (зі зменшеним на 1 обсягом вибірки):
Отримані значення статистики дозволяють судити про її розподілі і про характеристики розподілу - про математичне сподівання, медіані, Квантиль, розкиді, середньому квадратичному відхиленні. Значення статистики, побудовані за розмноженим підвибірках, не є незалежними, при зростанні обсягу вибірки вплив залежності може слабшати і зі значеннями статистик типу можна поводитися як з незалежними випадковими величинами.
Однак і без всякої ймовірносно-статистичної теорії розкид величин дає наочне уявлення про те, яку точність може дати розглянута статистична оцінка. Сам М. Кенуй і його послідовники використовували розмноження вибірок в основному для побудови оцінок із зменшеним зміщенням. А ось Б. Ефрон запропонував новий спосіб розмноження вибірок, істотно використовує датчики псевдовипадкових чисел. А саме, він запропонував будувати нові вибірки, моделюючи вибірки з емпіричного розподілу. Іншими словами, Б. Ефрон запропонував узяти кінцеву сукупність з n елементів вихідної вибірки і за д...