, що
(1.9.18)
Таким чином, статистика Оё = D * є зміщеною оцінкою для генеральної дисперсії Пѓ 2 . Однак зміщеність легко усувається шляхом введення коригуючого множника. Статистика
(1.9.19)
(так звана В«ВиправленаВ» вибіркова дисперсія) є незміщеної оцінкою генеральної дисперсії Пѓ 2 і використовується для її точкової оцінки.
Зауважимо, що при великому п ставлення і тому значення s 2 ≈ D *
У разі безповоротної вибірки можна показати, що точкова оцінка середньої буде тією ж (тобто * ), а точкова оцінка дисперсії повинна бути замінена на:
(1.9.20)
де N - обсяг генеральної сукупності
У разі безповоротної вибірки зміниться і вираз для D (*) , яке буде потрібно для побудови довірчого інтервалу при оцінці середньої:
(1.9.21)
При відносно невеликому обсязі вибірки і
3.5 Інтервальні оцінки середньої
При викладі даного питання будемо розрізняти випадки великих і малих вибірок. При цьому обидва випадки спочатку розглянемо в більш простий, з теоретичної точки зору, ситуації поворотної (повторної) вибірки.
3.5.1 Велика вибірка
Якщо обсяг вибірки досить великий (практично, починаючи з п > 20-30), то розподіл вибіркової середньої , згідно центральної граничної теоремі, незалежно від характеру генерального розподілу наближається до нормальному розподілу з параметрами
В
М () = і )
де - генеральна середня,
Пѓ-генеральне середнє квадратичне відхилення,
п - обсяг вибірки.
Таким чином, величина
В
розподілена по стандартного нормального закону (з математичним очікуванням M ( z ) = 0 і середнім квадратичним відхиленням Пѓ ( z ) = 1).
Поставивши собі довірчої ймовірністю Р = 1 - О± , визначаємо з рівності 2Ф (z) = 1 - О± відповідне значення z a (використовуємо при цьому таблицю інтегральної функції Лапласа). Тоді з імовірністю Р = 1 - О± виконується нерівність:
(1.9.22)
яке еквівалентно нерівності:
(1.9.23)
Величина називається граничною помилкою вибірки.
Таким чином, ми маємо довірчий інтервал для генеральної середньої:
(;)
Навпаки, якщо задана гранична помилка Оµ, а потрібно визначити ймовірність Р, то схема рішення задачі наступна:
Оµ в†’ z = в†’ Ф ( z ) в†’ P = 2Ф ( z ) (1.9.24)
Нарешті, визначення обсягу вибірки п за даними Р і Оµ проводиться за такою схемою:
В
P = 2Ф ( z ) в†’ z в†’ n = (1.9.25)
Приклад 1.9.4. Зважування 50 випадково відібраних коробок печива дало = 1200г. Визначити з імовірністю Р = 0,95 довірчі межі для середнього ваги коробки печива в генеральної сукупності, якщо є підстави вважати, що генеральна дисперсія Пѓ 2 = 11664. p> Рішення:
Дано: n = 50; = 1200; Пѓ 2 = 11664 ( = 108); Р = 0,95. p> З рівності Р = 2Ф ( z ) = 0,95 за таблицею значень інтегральної функції Лапласа знаходимо z = 1,96, звідки:
Оµ = (г)
Таким чином, отримуємо довірчий інтервал:
1200 - 30 <<1200 + 30. p> Приклад 1.9.5 Визначити, з якою довірчою ймовірністю можна стверджувати, що при даному обсязі вибірки (50 коробок) помилка вибірки не перевищить 20 р.
Рішення:
За величиною Оµ = 20 обчислюємо, звідки за таблицею Ф ( z ): Р = 2Ф (1,31) ≈ 0,81
Приклад 1.9.6. Визначити необхідний обсяг вибірки n , який з вірогідністю 0,99 гарантував би помилку вибірки не більш ніж Оµ = 20 р.
Рішення:
З Р = 2Ф ( z ) = 0,99 знаходимо z = 2,58, звідки:
коробок
Припущення про те, що генеральна дисперсія Пѓ 2 відома при невідомої генеральної середньої, на практиці виконується дуже рідко. Найчастіше все ми маємо лише вибіркові дані і можемо дати лише вибіркову оцінку s 2 невідомої дисперсії Пѓ 2 .
Статистика br/>
(1.9.26)
підпорядковується закону розподілу Стьюдента з v = n -1 ступенями свободи. Однак при великих значеннях параметра v ( v ≥ 30) розподіл Стьюдента практично збігається з нормальним. Тому в разі великих виб...