або шляхом комбінування цих способів. Який з підходів найбільш ефективний, залежить і від числа необхідних табуляцій, і від кількості подій в кожній табуляції. Чим менше число табуляцій потрібно і чим менше вибірка, тим більш привабливими стають ручні методи. Проте привабливість будь-якого підходу також в значній мірі залежить від складності табуляцій. Складність зростає в міру збільшення числа змінних, одержуваних для одночасної обробки в перехресної табуляції. Складність також зростає зі збільшенням числа категорій на одну змінну.
Хоча в дуже простих дослідженнях ручна табуляція може виявитися корисною, особливо якщо питань трохи і число можливих відповідей обмежена, більшість досліджень покладається на комп'ютерну табуляцію, що використовує пакети програм.
Існує величезна кількість таких програм. Деякі з них, на додаток до звітності про кількість подій у кожній категорії, можуть розраховувати підсумкові статистики і графічно представляти гістограми значень.
Просте табулювання крім відображення результатів дослідження, може використовуватися в кількох інших цілях:
· для визначення ступені не отримання відповіді на питання;
· для локалізації грубих помилок;
· для локалізації сторонніх значень;
· для визначення емпіричного розподілу розглянутої змінної;
· для розрахунку підсумкових статистик.
Перехресна табуляція - один з найбільш важливих механізмів для вивчення зв'язків всередині та між змінними, оскільки дозволяє легко пов'язувати результати. А, що найбільш важливо і цінно, що перехресна табуляція може забезпечити проникнення в природу взаємозв'язку подій, думок і т.д. Наприклад, кількість дітей по відношенню до віку респондента, таблиця 5.1.
Таблиця 5.1 - Спостережуване кількість дітей залежно від віку респондентів.
Кількість дітей, челВозраст респондентаВсего 18-26 лет27-35 лет36-45 лет46-55 лет121050172016183 і более01001Всего 21211126 6. Очищення і коректування даних
Майже завжди в результаті табулирования дослідник виявляє ряд проблем в зібраних даних. У цьому випадку виникає необхідність у проведенні коригування даних, яка може відбуватися у формі очищення даних або їх статистичної коригуванню.
Очищення даних ефективно проводити в наступних випадках:
відсутність відповіді, якщо це не було виявлено та усунуто на стадії редагування;
наявність даних, що виходять за межі конкретного діапазону;
надмірне відхилення від середнього.
. 1 Методи роботи з пропущеними відповідями
Відсутність відповідей виявляється істотною проблемою в більшості досліджень. По суті, ступінь безсловесності позицій часто служить корисним індикатором якості дослідження. Якщо вона досить висока, то можна ставити під сумнів результати всього дослідження в цілому. Якщо ж відсоток пропущених відповідей не великий, то застосовується ряд прийомів дозволяють працювати з такими даними.
Іноді доцільно виділити анкети з пропущеними відповідями в окрему категорію. Цей метод використовується у випадках простого одновимірного і перехресного табулювання.
Заміна відповіді нейтральним значенням. Найчастіше під нейтральним розуміється середнє значення. Така заміна використовується в кількісних питаннях. Вона не впливає на середнє значення показника і на коефіцієнти кореляції між показниками (розраховані по всій сукупності анкет). Тим не менш, при такій заміні все ж неминуче іскажается реальна картина, бо насправді даний респондент, швидше за все, відповів би по-іншому. Наприклад, особи, які мають високу заробітну плату часто відмовляються назвати дохід своєї сім'ї. При цьому, умовно приписувати їм середнє значення доходу навряд чи обгрунтовано.
Приписування умовного відповіді на підставі відповідей на інші питання. На основі наявних даних дослідник намагається визначити, які відповіді дав би конкретний респондент, якби він відповів на всі питання. Це можна зробити статистично, визначивши взаємозв'язку між пропущеної змінної та іншими змінними. Наприклад, можна побудувати залежність між обсягом споживання продукту і розміром сім'ї за анкетами, де є відповіді на обидва ці питання. Після цього в анкетах, в яких не вказано обсяг споживання продукту, проставляється його значення, розраховане з урахуванням розміру сім'ї. Такий метод вимагає значних зусиль, але і він може призводити до спотворень.
Виключення з аналізу анкет, що містять хоча б один пропущений відповідь. Цей метод може істотно вплинути на розмір вибірки, скоротивши ...