а потрапить в даний інтервал, і, навпаки, практично неможливо (Тобто з ймовірністю О±), що вона вийде за межі інтервалу. p> Але якщо Оµ 1 <Оѕ - Оћ * <Оµ 2 , то Оѕ * - Оµ 1 <Оѕ <Оѕ * + Оµ 2 , і рівність (1.9.5 *) запишеться у вигляді:
P (Оѕ * - Оµ 1 <Оѕ <Оѕ * + О• 2 ) = l - О± (1.9.5)
У силу викладеного
• інтервал (Оѕ * - Оµ 1 , Оѕ * + Оµ 2 ) називається довірчим інтервалом,
• числа Оѕ * - Оµ 1 , Оѕ * + Оµ 2 - довірчими межами,
• ймовірність Р = 1-О± - довірчою ймовірністю і
• О±- рівнем значущості (Суттєвості)
Довірчий інтервал доповнює точкову оцінку Оѕ * оцінкою помилки вибірки, або інтервального оцінкою параметра О±.
Якщо для точкового оцінки необхідно знати лише вираз для Оѕ * як функцію даних вибірки, то для побудови довірчого інтервалу необхідно знати також закон розподілу Оѕ *, за допомогою якого розраховується ймовірність (1.9.5). p> Часто при симетричному характер розподілу випадкової величини Оѕ * щодо Оѕ можна і довірчий інтервал розглядати як симетричний щодо Оѕ . У такому випадку рівняння (1.9.5) може бути замінено на більш просте:
P (Оѕ * - Оµ <Оѕ <Оѕ * + Оµ) = P (в”‚ Оѕ - Оћ * в”‚ <Оµ) = l - О± (1.9.6)
Величина Оµ називається граничної помилкою вибірки.
З інтервального оцінкою пов'язане рішення трьох типів завдань:
1) визначення довірчого інтервалу за заданою довірчої ймовірності Р = 1 - О± та обсягом вибірки п ;
2) визначення довірчої ймовірності по заданому довірчому інтервалу та обсягом вибірки;
3) визначення необхідного обсягу вибірки п по заданих довірчій ймовірності та довірчого інтервалу.
В
3.3 Оцінка частки ознаки
Для точкової оцінки частки ознаки у генеральній сукупності (р) природно взяти вибіркову частку
В
р * =
де n - Обсяг вибірки,
т - кількість одиниць у вибірці, що володіють даними ознакою. p> Можна довести, що ця оцінка є заможної, незміщеної, ефективною.
Питання про інтервального оцінці розглянемо спочатку для випадку поворотної вибірки.
При такій організації вибірки випадкова величина p *, як відомо з теорії ймовірностей, має біноміальний закон розподілу. Розрахунок довірчого інтервалу із застосуванням формули біноміального закону пов'язаний з певними обчислювальними труднощами. Однак при досить великому обсязі вибірки (приблизно n ≥ 20, п р ≥ 10 ) біноміальний розподіл добре апроксимується нормальним розподілом з параметрами
В
М ( p *) = p ;
Пѓ ( p *) =
Отже, випадкова величина має стандартний нормальний розподіл (З параметрами M (z) = 0; Пѓ (z) = 1). p> Поставивши собі певної ймовірністю Р = 1 - О±, маємо:
2 Ф (z О± ) = 1 - О± (1.9.7)
де Ф (z О± ) = - інтегральна функція Лапласа, значення якої для різних значень z розраховані і наводяться в спеціальних таблицях.
Рівність (1.9.7) еквівалентно рівності:
В
P {в”‚ p * - p в”‚ 1 В· Пѓ ( p *)} = 2 Ф (z О± ) (1.9.7 ')
Таким чином, гранична помилка вибірки Оµ О± визначається з рівності:
(1.9.8) br/>
Застосування цієї формули може тим, що в неї входить невідомий параметр р - генеральна частка. Однак при великому п можна замінити невідомий параметр р його точкової оцінкою р *. Тоді отримаємо:
(1.9.9)
Наведені вище формули пов'язують між собою, в кінцевому рахунку, три величини: довірчу ймовірність Р = 1-О±, граничну помилку вибірки Оµ і обсяг вибірки п.
У кожній конкретній задачі дві з цих величин задаються і визначається третя величина. Таким чином, ми маємо наступні три типи завдань:
I. Дано п і Р , визначити Оµ.
II. Дано п і Оµ, визначити Р .
III. Дано Р і Оµ, визначити п
Перші два типи завдань пов'язані з аналізом результатів уже виробленої вибірки обсягу п, отже, і з знайденої точкової оцінкою р *.
Завдання третього типу повинні вирішуватися до проведення вибірки. За заданою довірчої ймовірності P ми можемо визначити величину z (по таблиці інтегральної функції Лапласа). З (1.9.9) отримуємо:
(1.9.10)
Однак у (1.9.10) входить величина р * , отриму...