Так, наприклад, дані про місце проживання домогосподарства я перетворила у двійкову змінну місто = 1/село = 0, тоді як вихідна змінна містила 4 градації (в частині аналізу це показано). Це вигідно, тому що мені було потрібно включити цю змінну в регресійну модель, а це допускається лише для кількісних, або для двійкових змінних. А число джерел доходів я взагалі вважала за кількома змінним, де респонденту пропонувався цілий спектр джерел доходів і пропонувалося погодитися або не погодитися що чергове джерело доходів використовується сім'єю респондента.
Всього в обчисленнях задіяно більше 30 змінних. Це відображено в синтаксисі (див. додаток).
Приклад самої бази даних представлений в наступній таблиці:
Приклад бази даних
Ім'я
перем.
Номер сім'ї
iid_h
Ic9.1a
Ic9.1b
...
indexTDP1
...
1
10101
1
8
...
0,51
...
2
10102
1
20
...
0,72
...
3
10103
1
24
...
0,54
...
4
10105
2
...
0
...
5
10107
1
6
...
1,11
...
6
10112
99
...
0
...
...
...
...
...
...
...
...
Це фрагмент даний у тому форматі, який відображається в SPSS. По горизонталі - сім'ї, по вертикалі - змінні (Показники). Наприклад, змінна iid_h - код сім'ї в 13-й хвилі (2004 рік), ic9.1a - показник того, чи є в домогосподарстві холодильник (код 1), чи ні (код 2), ic9.1b - містить вік холодильника, indexTDP1 - це вже розрахований мною індекс забезпеченості ТДП. Наприклад, з тих сімей, що є в даному фрагменті, найбільш забезпеченої, ймовірно, є сім'я № 5.
Значення В«99В» для змінної ic9.1a не є істинними її значеннями, а позначають, що респондент відмовився відповісти на дане питання. Цей (і інші коди, що означають пропущені значення), слід перед початком роботи оголосити пропущеними, щоб програма виключала їх з аналізу.
4. Аналіз даних і інтерпретація
Для початку я проаналізую розподілу тих перемінних, котрі я планую використовувати в регресійних моделях. Це дохід, число членів сім'ї, число джерел доходу, міська/сільська місцевість, а також - показники володіння товарами тривалого користування.
Розподіл домогосподарств за доходом
Число домогосподарств
Мінімальний дохід, руб.
Максимальний дохід, руб.
Середній дохід, руб.
Медіана доходу, руб.
Ст. вимк. доходу, руб.
4711
0
706964
10005
6400
22237
Графа В«число домогосподарств В»показує, скільки домогосподарств погодилися розкрити свої доходи. Медіана менше середнього, це означає, що на середнє значення доходу сильно вплинули сім'ї з великими доходами, що різко відрізняються від доходів основної маси опитаних. p> Мінімальний і максимальний (і навіть середній) доходи ще далеко не всі говорять про розподіл змінної, тому краще уявлення про розподіл доходу дає зрозуміти гістограма розподілу доходу.
Гістограма розподілу респондентів за доходом
Оскільки є незначне число великих доходів, гістограма не надто вдала вийшла. Розглянемо краще квартили розподілу доходу, які скажуть, з якою величини починаються 25% мінімальних доходів, медіану і з якої величини починаються +25% Найбільших. Ось вони:
Кварта розподілу доходу
I
II
III
3100 ...