і цих виробів представимо у вигляді матриці спостережень
= (xij), (i = 1, 2, ..., m; j = 1, 2, ..., n).
Необхідно перевірити істотність впливу партій виробів на їх якість.
Якщо вважати, що елементи рядків матриці спостережень - це чисельні значення (реалізації) випадкових величин Х1, Х2, ..., Хm, що виражають якість виробів і мають нормальний закон розподілу з математичними очікуваннями відповідно а1, А2, ..., ат і однаковими дисперсіями, то дана задача зводиться до перевірки нульової гіпотези H0: а1 = а2 = ... = ат, здійснюваної у дисперсійному аналізі.
Позначимо усереднення по якомусь індексом зірочкою (або крапкою) замість індексу, тоді середній показник якості виробів i-й партії, або групова середня для i-го рівня фактора, прийме вигляд:
(4)
а загальна середня -
(5)
Розглянемо суму квадратів відхилень спостережень xij від загальної середньої:
, (6)
або Q = Q1 + Q2 + Q3.
Останній доданок
Q3 = 2,
так як сума відхилень значень змінної від її середньої, тобто
дорівнює нулю.
Перший доданок можна записати у вигляді:
Q == n. (7)
В результаті отримаємо наступне тотожність:
Q = Q1 + Q2 (8)
Де Q = - загальна, або повна, сума квадратів відхилень;
Q1 = n - сума квадратів відхилень групових середніх від загальної середньої, або межгрупповая (факторна) сума квадратів відхилень;
Q2 = - сума квадратів відхилень спостережень від групових середніх, або внутригрупповая (залишкова) сума квадратів відхилень.
У розкладанні (8) укладена основна ідея дисперсійного аналізу. Якщо поділити обидві частини рівності (8) на число спостережень, то отримаємо правило складання дисперсій. Стосовно до розглянутої задачі рівність (8) показує, що загальна варіація показника якості, виміряна сумою Q, складається з двох компонент - Q1 і Q2, що характеризують мінливість цього показника між партіями (Q1) і мінливість В«всерединіВ» партій (Q2), що характеризують однакову (за умовою) для всіх партій варіацію під впливом неврахованих факторів.
У дисперсійному аналізі аналізуються не власними суми квадратів відхилень, а так звані середні квадрати, які є незміщеними оцінками відповідних дисперсій, які виходять розподілом сум квадратів відхилень на відповідне число ступенів свободи.
Нагадаємо, що число ступенів свободи визначається як загальне число спостережень мінус число зв'язують їх рівнянь. Тому для середнього квадрата S12, що є незміщеної оцінкою міжгруповий дисперсії, число ступенів свободи k1 = m - 1, так як при його розрахунку використовуються m групових середніх, пов'язаних між собою одним рівнянням (5). p align="justify"> А для середнього квадрата S22, що є незміщеної оцінкою внутрішньогрупової дисперсії, число ступенів свободи k2 = mn-m, б...