нісної (випадкової) вибірки, в якому підкреслювалося рівність шансів потрапляння у вибірку для всіх вхідних в генеральну сукупність одиниць-В«випадківВ»? Деякі статистики вважають запропоноване нами вище визначення не цілком точним і вважають за краще говорити про ймовірнісної вибіркою як про вибірку, де кожна одиниця відбору мຠ«³дому, ненулевую ймовірність бути включеною до вибіркиВ», хоча шанси для різних одиниць не обов'язково рівні. Існуюче різноманіття визначень ймовірнісної вибірки сходить до давньої дискусії про правомірність висновків, заснованих на апріорних (В«доВ») і апостеріорних (В«після випробуванняВ») ймовірностях. Ми, однак, збережемо наше визначення випадкової вибірки, внісши до нього деяке уточнення: коли шанси потрапляння у вибірку нерівні, як при непропорційному відборі з страт, вони можуть бути вирівняні за допомогою зважування на стадії аналізу, тобто на власне послевиборочной стадії дослідження (звичайно, якщо відбір всередині страт зберігає свій випадковий і равновероятности характер). Для цього потрібно внести певні поправки до отримані дані, а саме - приписати деякими спостереженнями (класам спостережень) більший В«вагуВ», компенсуючий менші шанси потрапляння у вибірку (і навпаки).
Результатом приписування ваги кожному спостереженню є збільшення точності оцінок для досліджуваних параметрів. Вага кожної одиниці (Респонденти) в k-й страті дорівнює відношенню числа таких елементів у генеральній сукупності до обсягу вибірки для k-й страти, тобто:
В
При розрахунку середнього або інших параметрів кожне спостерігалося значення просто множиться на ваговий коефіцієнт В«своєїВ» страти. p> Зокрема, середнє значення якогось параметра сукупності (наприклад, середній прибуток або середня кількість хронічних захворювань) буде дорівнювати просто зваженої сумі середніх значень для окремих страт:
В
Формула розрахунку стандартної помилки для стратифікованої вибірки також включає в себе вагові коефіцієнти, w:
В
Стандартні комп'ютерні програми, використовувані при статистичному аналізі даних, завжди містять елементарні процедури зважування. p> Повернемося до нашого прикладу з непропорційним стратифікованим отбoром російської та української населення. Припустимо, ми з'ясували, що в середньому кожна українська сім'я заготовляє на зиму 50 кг варення, тоді як середнє значення для російської страти склало 40 кг. p> Для української страти ваговий коефіцієнт складе:
w укр. = 10000 : 400 = 25. br/>
Відповідно для російського населення:
w рос. = 80000: 400 = 200. br/>
З урахуванням цих вагових коефіцієнтів уточнена оцінка середнього запасу варення у вибірці складе:
х = 25 • 50 • 400 + 200 • 40 • 400/100000 = 37 кг.
Якби ми не врахували у своїх розрахунках сверхпредставітельность українців у нашій непропорційною стратифікованої вибірці, то оцінка середнього запасу варення для всієї сукупності виявилася б завищеною (45 кг).
Четвертий тип ймовірнісної вибірки, використовуваної соціологами, - це кластерна вибірка. В«КластериВ» (дослівно з англ. - Грона) - це природні угруповання одиниць спостереження. Наприклад, популяція виборців має тенденцію жити в містах і селах, генеральна сукупність військовослужбовців природним чином групується по військових частинах і підрозділам, а сукупність студентів - по університетах, інститутах і коледжам. Здатність до утворення локальних угруповань, яку виявляють генеральні сукупності, досліджувані соціологами, при дотриманні ряду умов дозволяє зменшити витрати на отримання одиниці інформації.
Мета використання кластерної вибірки таким чином полягає у підвищенні ефективності витрат на проведення дослідження. При фіксованому бюджеті та обсязі вибірки соціолог отримує можливість знизити загальні витрати на проведення особистих інтерв'ю переважно за рахунок зменшення транспортних витрат.
У загальному випадку кластерна вибірка заснована на початковому відборі угруповань (кластерів) і потім - на вивченні всіх одиниць всередині кластерів. Можливими прикладами кластерів, використовуваних у великих загальнонаціональних опитуваннях, є сільські райони, міські квартири, виборчі дільниці. При вивченні специфічних популяцій використовуються інші кластери: лікарні - при вивченні пацієнтів, школи - при вивченні школярів і т. п.
Коректне застосування кластерної процедури засноване на неухильному дотриманні чотирьох необхідних умов:
1) кластери повинні бути однозначно і явно задані: кожен член генеральної сукупності повинен належати до одного (і тільки одному) кластеру;
2) число членів генеральної сукупності, що входять в кожен кластер, має бути відомо або піддаватися оцінці з прийнятною ступенем точності;
3) кластери повинні бути не занадто великі і географічно компактні, інакше кластерна вибірка втрачає всякий фінансовий сенс; <...