но нижче (таблиця 3.4).
Таблиця 3.4? Приклад категоріальної кодування даних. Питання анкети: «Чи має для Вас значення бренд одягу?»
Номер анкетиЗначеніе змінної «Значимість бренду» (1 - ні, не має; 2 - скоріше ні; 3 - скоріше так; 4 - так, має) 112232 Найбільшу проблему для кодувальника представляють відкриті запитання. Існують метод, коли тексти, вимовлені респондентами у відповідь на відкрите запитання, вводяться у відповідну колонку таблиці даних. При використанні інших технологій самі тексти відповідей в таблицю не додають. Замість цього дещо пізніше туди вносяться коди відповідей.
Незалежно від того, додаються тексти в таблицю даних чи ні, здійснюється кодування відкритих питань. При кодуванні кожного відкритого питання умовно формується ще один - спільний, тобто в таблицю даних праворуч дописується набір числових стовпців. Кожен з таких стовпців відповідає за певний сенс: у ньому, як у звичайному спільному питанні, ставляться одиниці або нулі в залежності від того, відображений або не відбитий даний сенс у відповіді респондента.
Кодування відкритих питань - досить трудомістка робота. Лише в окремих випадках коди можливих відповідей на ці питання готуються заздалегідь, до початку польових робіт. Набагато частіше ці коди розробляються на основі текстів, записаних у отриманих з поля анкетах, для цього переглядають не всі, а лише частину заповнених анкет - зазвичай від 50 до 100.
В результаті цього перегляду розробляється так званий кодифікатор - набір формалізованих варіантів, кожен з яких відображає який-небудь один смисловий аспект. Кожному з цих варіантів приписується певний числовий код.
При розробці кодификатора зазвичай дотримуються двох важливих правил.
По-перше, в сукупності вони повинні вичерпувати все безліч можливих ситуацій. Якщо варіантів відповідей виявляється занадто багато, ті з них, які зустрічаються відносно рідко, об'єднуються в позицію інше raquo ;. Однак до цієї категорії дослідник зазвичай має право віднести не більше 10% респондентів.
По-друге, коди змістовно важливих позицій необхідно вставляти, навіть якщо відповідні їм смисли виражалися респондентами рідко або навіть не виражалися зовсім, оскільки відсутність згадок - теж інформація.
Після розробки кодификатора кодировщик переглядає весь набір відповідей і приписує кожному з них в залежності від вмісту один або кілька кодів, яким він відповідає за змістом.
При кодуванні даних необхідно дотримуватися існуючих загальним принципам:
· розташовувати тільки один символ у кожному стовпчику. Коли питання допускає безліч варіантів відповідей, кожен варіант відповіді розміщувати в окремій колонці.
· використовувати тільки числові коди, а не букви алфавіту або спеціальні символи або знаки, тому що для більшості комп'ютерних програм при обробці даних маніпулювання чимось іншим, ніж цифри, пов'язане з труднощами;
· використовувати рівно стільки колонок поля, призначуваного для змінної, скільки необхідно для повного охоплення всіх її можливих значень. Крім того кожному полю повинна призначатися не більше ніж одна змінна;
· використовувати стандартні коди для «відсутності інформації». Так всі відповіді «не знаю» повинні кодуватися цифрою 8, «ні відповідей» - цифрою 9, а «не застосовувалася» позначатися як 0.
· кодувати ідентифікаційний номер респондента для кожної анкети. Як правило, немає необхідності ідентифікувати в цьому номері ім'я респондента. Цей код просто пов'язує анкету з кодованими даними. Така інформація часто корисна на етапі очищенні даних.
3.3 Книга кодів
Завершальний етап процесу кодування полягає в підготовці книги кодів, яка містить загальні інструкції, що вказують, яким чином була закодована кожна позиція даних.
Книга кодів - це книга, в якій описується кожна змінна, в ній перераховуються коди кожної змінної і категорії, включені в кожен код. Далі в ній вказується, де в комп'ютерного запису розташовується змінна і яким чином ця змінна читається - наприклад, з десятковою крапкою або як ціле число. Приклад книги кодів наведено в таблиці 3.5.
редагування кодування анкетування
Таблиця 3.5? Фрагмент книги кодів для дослідження покупців дитячого одягу.
Номер переменнойНаіменованіе переменнойНомер вопросаЗначеніе меткіКод пропускаКол. сімволов1колічество дітей11=одна; 2=дві; 3=три, 4=більше трьох 12пол детей2а1=хлопчики; 2=дівчинки; 3=хлопчик і девочка9 13а, 3б..возраст детей2бкак зазначено в анкете9 4кто приймає рішення про покупку для дев...