ві труднощі і очікуване подальший розвиток. Виконувати таку програму в повному обсязі зараз навряд чи здійсненно, але спробуємо все-таки сформулювати деякі основні твердження. [1]
1.1 Концепція максимальної правдоподібності
Насамперед, доводиться констатувати, що підхід Б. Ефрона виник під сильним впливом ідей Р. Фішера - в основному концепції максимальної правдоподібності, що з'явилася в 1912 р З неї, власне, випливає, що те, що спостерігалося в експерименті, якраз і" повинно було статися. Тому всі невідомі, які нам належить витягти з експерименту, треба знаходити таким чином, щоб вони якомога краще узгоджувалися з наявними даними. Тоді оцінки невідомих і будуть« найбільш правдоподібними »у світлі наявних даних. Багаторічна інтенсивний розвиток цієї концепції перетворило її на один із наріжних каменів сучасної математичної статистики.
Але є три обставини, що заважають нам повною мірою усвідомити переваги підходу, заснованого на принципі максимальної правдоподібності. Це - можливе зміщення на кінцевих вибірках (а з іншими ми, на жаль, не маємо справи), потреба в істотній апріорної інформації (знанні виду закону розподілу досліджуваних випадкових величин) та обчислювальні труднощі. Втім, останні не мають принципового характеру, зате з першими двома доводиться рахуватися. Бутстреп-метод спочатку виник як засіб подолання вибіркового зміщення або, у всякому разі, як засіб його істотного зменшення. Якщо з'ясується, що він коректний, то з цього буде випливати, що класична процедура методу максимуму правдоподібності не дозволяє витягти з вибірки всю наявну в ній інформацію. [1], [6].
1.2 Рандомизация
Звернемося до принципом рандомізації, запропонованому Р. Фішером. Часто замість рандомізації вживають термін «перестановочний тест» (permutation), маючи на увазі перестановку даних між окремими групами. Цей термін не цілком вдалий, оскільки насправді здійснюються не перестановки, а беруться різні комбінації даних, унікальних щодо обраної тестової статистики. Рандомизация - штучне внесення випадковості в експеримент для перетворення деяких систематичних помилок у випадкові. Вона справила величезний вплив і на теоретичні, і на прикладні дослідження в багатьох областях статистики, особливо в плануванні експерименту.
Цей метод дозволяє ефективно зменшувати систематичну похибку (методичну та інструментальну) шляхом вимірювання деякої фізичної величини поруч однотипних приладів з подальшою оцінкою результату вимірювань у вигляді математичного очікування (середнього арифметичного значення) виконаного ряду спостережень. У даному методі при обробці результатів вимірювань використовуються випадкові зміни похибки від приладу до приладу. Зменшення систематичної похибки досягається і при зміні випадковим чином методики та умов проведення вимірювань.
Метод рандомізації використовується при моделюванні, коли:
а) випадкові властивості, пов'язані з надійністю, ефективністю, настанням події, часом функціонування або помилками вимірювань в системі або середовищі, впливають на результати моделювання;
б) необхідно отримати швидше приватні, ніж узагальнені, результати;
в) необхідно визначити закони розподілу результатів і поряд із середніми значеннями обчислити дисперсії.
Ось як характеризують цю ідею Р. Фішера М. Кендалл і А. Стьюарт: «... Можливо, не буде перебільшенням сказати, що його (Р. Фішера) пропаганда рандомізації при плануванні експериментів була найважливішим і мають найбільший вплив результатом з його численних досягнень в статистиці »[5].
Для практичного здійснення рандомізації потрібен якийсь механізм. У цій ролі зазвичай виступають таблиці або генератори випадкових чисел. Якість одержуваних випадкових чисел має велике значення у всіх областях їх використання, у тому числі і в Бутстреп.
Окремим випадком рандомізації є рандомізаційних тест. Основна його мета полягає в тому, щоб перевірити деяку нульову гіпотезу. Розглянемо схему реалізації рандомізаційних тесту для порівняння двох незалежних вибірок:
. Виберемо метрику T , що дозволяє оцінити статистичну значущість можливого фактора відмінностей двох груп даних. В якості такої зручніше використовувати різницю між вибірковими середніми.
. Обчислимо значення статистики для вихідних даних t вих
. Повторюємо N раз наступні дії:
· Випадковим чином перемішуємо дані обох вибірок.
· Перші n1 спостережень відбираємо в першу групу, решта n2 - в другу.
· Обчислюємо значення статистики t РНД для рандоміз...