le [48], United Nations [46] і The World Bank [44]. Для практичної реалізації використовувалися такі програмні додатки, як MS Excel і Stata.
Крім того, попередні автори емпіричних робіт використовували як демографічних показників коефіцієнт народжуваності, смертності або очікувану тривалість життя, а я буду використовувати у своїй роботі показники структури населення (частка осіб у віці 65 років і старше, коефіцієнт демографічного навантаження літніми), які поєднують в собі такі демографічні зміни, як народжуваність і смертність.
Кількість зібраних змінних дорівнює 26, але в процесі дослідження деякі з них були видалені. Опис змінних і їх кодування представлені в таблиці 4.
. 2 Статистичний аналіз і обробка даних
Для подальшого дослідження необхідно провести описовий аналіз всіх використовуваних змінних, щоб видалити незначущі спостереження або змінні.
Виходячи з таблиці 5, можна говорити про те, що не по всіх спостережуваним змінним є інформація з 1990 по 2012 рр. Наприклад кількість спостережень за часткою витрат на НДДКР у ВВП одно 512 (дані з 1990 по 1996 не були знайдені).
Звернувши увагу на зростання ВВП і зростання ВВП на душу населення, видно, що за 23 роки він варіюється від - 14,6% до 14%. Якщо подивитися на демографічні показники, наприклад на частку людей у ??віці 65 і старше в загальній чисельності населення, то мінімальне значення=3%, а максимальне=24%. Такий великий розрив між мінімальним і максимальним пов'язаний з тим, що ми використовуємо великий проміжок часу, і як говорилося в розділі 3, частка літнього населення з кожним роком зростає, тобто в 1990-2000 рр. частка пенсіонерів була мала, а після 2000 року ця частка з кожним роком підвищувалася. Проаналізувавши всі змінні, можна сказати, що в даній вибірці немає сильних викидів, так як по всім змінним середнє значення приблизно дорівнює медіані.
Тепер подивимося на розподіл ключових кількісних змінних. Спочатку оцінимо нормальність розподілу залежною змінною GdpCgrow (рис. 14).
Таблиця 4
Опис і кодування використовуваних змінних
№Названіе переменнойОпісаніе1YearГод (1990-2012) 2CountryСтрана3Gdp_GrowthГодовой темп зростання ВВП (%) 4GdpCgrowГодовой темп зростання ВВП на душу населення (%) 5GdpCВВП на душу населення (долари США) 6InvДоля інвестицій у ВВП (%) 7Lab_RateДоля економічно активного населення у віковій групі 15-648ExpДоля експорту товарів і послуг у ВВП (%) 9ImpДоля імпорту товарів і послуг у ВВП (%) 10OpenОткритость торгівлі (11Pub_Spend_EdДоля державних витрат на освіту у ВВП (%) 12Helth_ExpCОбщіе витрати на охорону здоров'я (долари США) 13Res_ExpДоля витрат на НДДКР у ВВП (%) 14Gov_ConДоля державних витрат у ВВП (%) 15Old_DepКоеффіціент демографічного навантаження літніми (частка утриманців на 100 осіб працездатного віку) 16Young_DepКоеффіціент демографічного навантаження дітьми (частка утриманців на 100 осіб працездатного віку) 17Age_DepКоеффіціент загальної демографічного навантаження (частка утриманців на 100 осіб працездатного віку) 18P65RНаселеніе у віці 65 років і старше (% від загального числа) 19P014RНаселеніе у віці до 15 років (% від загального числа) 20Life_ExpОжідаемая тривалість життя при народженні (кількість років) 21FertRКоеффіціент народжуваності (кількість дітей на одну жінку) 22DeathRКоеффіціент смертності ( на 1000 чоловік) 23Pop_GrГодовой приріст населення (%) 24Pop_DenПлотность населення (осіб на км2) 25Sec_SchПродолжітельность середньої освіти (кількість років) 26Ter_EnrolДоля випускників шкіл, зарахованих до ВНЗ (%)
Таблиця 5
Описова статистика для всіх кількісних змінних
Рис. 14. Розподіл залежною змінною GdpCgrow
На малюнку 14 видно, що ймовірність того, що зростання ВВП на душу населення розподілений нормально, мала. Звідси випливає висновок, що і залишки, найімовірніше, будуть розподілені не є нормально, і, отже, перевірка різних гіпотез буде не зовсім коректна. Для наближення розподілу до нормального необхідно перетворити змінну.
Якщо проведемо формальні тести на нормальність розподілу, то все 3 тесту на нормальність дозволяють відкинути нульову гіпотезу про нормальність розподілу ціни (табл. 6).
Таблиця 6
Формальні тести на нормальність розподілу
Варто відзначити, що і решта кількісні змінні так само мають розподіл, відмінне від нормального (на підставі формальних тестів та ядерної оцінки щільності).
Тепер проаналізуємо взаємозв'язку змінних між собою. Для цього побудуємо кореляційну матрицю між кількісними змінними (т...