аційних даних.
· Якщо t РНД gt; t вих збільшуємо на 1 лічильник S
. Розділивши значення S на N, отримаємо співвідношення частот, з якою метрика t РНД на рандомізованих даних перевищила значення t вих на даних, які ми отримали в експерименті. Іншими словами, обчислимо оцінку ймовірності р того, що випадкова величина Т прийме значення, більше, ніж t вих. За традицією, якщо р gt; 0,05, то приймається нульова гіпотеза H 0 про відсутність значущих відмінностей вихідних вибірок від їх нуль-моделі за індексом Т , а якщо р менше задаваемого рівня значущості, то H 0 відхиляється в користь альтернативи.
Розберемо конкретний приклад. Нехай показники напрацювання на відмову групи з трьох ІРЕ склали, відповідно, 85, 105 і 115 000 годин. Тоді як цей показник групи контролю з чотирьох ІРЕ, у яких була проведена заміна інтегральних мікросхем імпортними аналогами - 110, 125, 125 і 130 000 годин. Якщо заміна не впливає на показник надійності і нульова гіпотеза про відсутність відмінностей між групами вірна, то будь-які 3 з наявних 7 спостережень з однаковою ймовірністю могли б бути приписані до контрольної сукупності, а решта - до групи з впливом (тобто спостерігалося б явище «exchangeable» або «обмениваемости» даних). Випишемо всі 35 можливих варіантів разбиений 7 вимірювань на 2 групи (таблиця 1.2.1). Проаналізувавши результати, ми легко знайдемо, що є тільки одна псевдо-комбінація даних, при якій середнє значення для контрольної групи було б ще менше (а для групи з впливом, відповідно, ще більше), ніж це отримано в експерименті. Таким чином, різниця між групами, настільки ж велике як це зафіксовано емпірично, сталося б тільки в 2 випадках з 35, тобто ймовірність справедливості сформульованої нульової гіпотези становить 0.0571.
Таблиця 1.2.1
1 группаГрупповое среднее2 группаГрупповое среднее85105115101,67110125125130122,585105110100,00115125125130123,7585105125105,0011511012513012085105125105,0011511012513012085105130106,67115110125125118,7585115110103,33105125125130121,2585115125108,33105110125130117,585115125108,33105110125130117,585115130110,00105110125125116,2585110125106,67105115125130118,7585110125106,67105115125130118,7585110130108,33105115125125117,585125125111,6710511511013011585125130113,33105115110125113,7585125130113,33105115110125113,75105115110110,0085125125130116,25105115125115,0085110125130112,5105115125115,0085110125130112,5105115130116,6785110125125111,25105110125113,3385115125130113,75105110125113,3385115125130113,75105110130115,0085115125125112,5105125125118,3385115110130110105125130120,0085115110125108,75105125130120,0085115110125108,75115110125116,6785105125130111,25115110125116,6785105125130111,25115110130118,3385105125125110115125125121,6785105110130107,5115125130123,3385105110125106,25115125130123,3385105110125106,25110125125120,0085105115130108,75110125130121,6785105115125107,5110125130121,6785105115125107,5125125130126,6785105115110103,75
1.3 Поняття повторних дослідів
Звернемося тепер до планування експериментів. Крім понять зсуву і рандомізації, нам знадобиться тепер поняття повторних (паралельних) дослідів. Уявіть собі дослідне поле квадратної форми. Вам належить з'ясувати вплив на врожай глибини оранки та кількості внесених добрив. Щоб отримати ділянки для різної оранки, розділимо квадрат навпіл горизонтальною рисою. Верхню частину поля будемо орати на одну глибину, а нижню - на іншу. Порівняємо врожаї з цих двох делянок: де врожай більше, там і глибина оранки виявилася більш підходящою. Тепер, щоб врахувати вплив добрив, розділимо дослідне поле знову навпіл, але на цей раз по вертикалі. На праву половину внесемо велика кількість добрив, а на ліву - мале. Ми отримали 4 ділянки, кожна з яких характеризується своїм поєднанням умов обробки грунту під урожай. А логіка порівнянь залишається колишньою. Не ясно тільки, як вибрати масштаб для порівняння врожаїв.
Звичайно, ідея про багаторазовому повторенні дослідів в однакових, наскільки можливо, умовах з'явилася задовго до Р. Фішера. Вона була одним з основних принципів наукового дослідження. Здавалося б, спираючись на цей принцип, треба розділити кожну з вийшов делянок на деяке число однакових повторних делянок і на підставі відмінностей в їх врожаях оцінити помилку відтворюваності експерименту, яка і може служити еталоном, масштабом для порівняння обробок і отримання відповідей на цікаві для нас питання про вплив на врожай глибини оранки та кількості добрив. Однак такий поділ може призвести до зміщення оцінок через особливості врожайності, рельєфу та інших властивостей дослідного поля. Панацеєю від такого зміщення виявилася рандомізація. Вельми близьку міркування провів і Б. Ефрон, перенісши рандомізацію на процедури обробки даних. І це ...