Кореляційний аналіз - метод обробки статистичних даних, за допомогою якого вимірюється тіснота зв'язку між двома або більше змінними. Кореляційний аналіз тісно пов'язаний з регресійним аналізом (також часто зустрічається термін «кореляційно-регресійний аналіз», який є більш загальним статистичним поняттям), з його допомогою визначають необхідність включення тих чи інших факторів в рівняння множинної регресії, а також оцінюють отримане рівняння регресії на відповідність виявленим зв'язках (використовуючи коефіцієнт детермінації).
Коефіцієнт детермінації (R2) - це частка дисперсії відхилень залежної змінної від її середнього значення, яка пояснюється розглянутої моделлю зв'язку (пояснюючими змінними). Модель зв'язку зазвичай задається як явна функція від пояснюють змінних. В окремому випадку лінійного зв'язку R2 є квадратом коефіцієнта кореляції між залежною змінною і пояснюючими змінними.
Загальна формула для обчислення коефіцієнта детермінації:
де yi - спостережуване значення залежної змінної, а fi - значення залежної змінної передбачене по рівнянню регресії -середнє арифметичне залежною змінною.
При перевірці гіпотези про наявність зв'язку модель зв'язку може бути невідома. Тоді її задають у вигляді кусочно-постійної функції (в цьому випадку коефіцієнт детермінації дорівнює квадрату кореляційного відношення) або оцінюють невідомі значення функції зв'язку, використовуючи методи згладжування емпіричної залежності
Регресійний (лінійний) аналіз - статистичний метод дослідження залежності між залежною змінною Y і однією або декількома незалежними змінними X1, X2, ..., Xp. Незалежні змінні інакше називають регресорів або предикторами, а залежні змінні - критеріальними. Термінологія залежних і незалежних змінних відображає лише математичну залежність змінних, а не причинно-наслідкові відносини.
Цілі регресійного аналізу
Визначення ступеня детермінованості варіації критеріальною (залежної) змінної предикторами (незалежними змінними);
Передбачення значення залежної змінної за допомогою незалежної;
Визначення внеску окремих незалежних змінних в варіацію залежною.
Регресійний аналіз не можна використовувати для визначення наявності зв'язку між змінними, оскільки наявність такого зв'язку і є передумова для застосування аналізу.
Множинна регресія - рівняння зв'язку з декількома незалежними змінними:
де
- залежна змінна (результативна ознака);
- незалежні змінні (фактори).
Для побудови рівняння множинної регресії частіше використовуються наступні функції:
лінійна -
статечна -
експонента -
гіпербола -.
Критерій Фішера (F-критерій,? * - критерій, критерій найменшою значущою різниці) - апостеріорний статистичний критерій, використовуваний для порівняння дисперсій двох варіаційних рядів, тобто для визначення значущих відмінностей між груповими середніми в установці дисперсійного аналізу. Критерій Фішера широко застосовується в задачах статистичного оцінювання, зокрема в аналітичній хімії.
Значимість рівняння множинної регресії в цілому оцінюється за допомогою F-критерію Фішера:
t-критерій Стьюдента - загальна назва для класу методів статистичної перевірки гіпотез (статистичних критеріїв), заснованих на порівнянні з розподілом Стьюдента. Найбільш часті випадки застосування t-критерію пов'язані з перевіркою рівності середніх значень у двох вибірках. Для застосування даного критерію необхідно, щоб вихідні дані мали нормальний розподіл. У разі застосування двухвиборочного критерію для незалежних вибірок також необхідне дотримання умови рівності дисперсій.
Розрахунок прибутку з використанням економічних моделей з фіктивними змінними.
Для розрахунку прибутку необхідно ввести незалежні змінні. Введемо наступні незалежні змінні:
x, t =, t =, t =, t=
Введемо наступні фіктивні змінні:=1, якщо спостереження належить до I кварталу;=1, якщо спостереження належить до II кварталу;=1, якщо спостереження належить до III кварталу;=0, якщо спостереження належить до IV кварталу.
Зробимо ряд необхідних розрахунків, з введенням незалежних змінних. Звернемося до пакету «STATISTICA», щоб зробити необхідні розрахунки.
Таблиця 3.3
Значення незалежних змінних, при введення x.
Кварталыyxu1u2u3I1174501100II1566002010III2349003001IV2740504000V1565205100VI2124206010VII3130407001VII4360208000
Таблиця 3.4.
Отримані дані по пакету «STATISTICA»
Змінна ПараметриСтандартние отклоненіяt (3) - статістікаУровень значимостиКонстанта22941049168,284,665810,018585x209386818,413,070730,054531u1-15523843659,15-3,555670,037937u2-12865040910,48-3,144670,051477u3-6012839168,81-1,53...