есія - залежність середнього значення якої-небудь величини Y від іншої величини X. Поняття регресії в деякому сенсі узагальнює поняття функціональної залежності y=f (x). Тільки у випадку регресії одному і тому ж значенню x в різних випадках відповідають різні значення у.
Регресійний аналіз полягає у визначенні аналітичного вираження зв'язку, в якій зміна однієї величини (званою залежною або результативним ознакою) обумовлено впливом однієї або декількох незалежних величин (факторів).
За формою залежності розрізняють:
1. лінійну регресію, яка виражається рівнянням прямої:
2. нелінійну (параболічну):
Дослідження лінійної регресії:
Визначимо коефіцієнти лінійної функції методом найменших квадратів. Для цього складемо суму
Для того щоб ця сума була мінімальною, необхідно, щоб її приватні похідні за параметрами A і B були рівні нулю
Розкривши дужки, ми отримаємо
Висловимо a і b
Одним з найважливіших методів визначення залежності між X і Y є метод найменших квадратів. Бачачи загальне розташування точок, можна припустити, що ця залежність лінійна. Кількість прямих, що проходять через задану сукупність точок, нескінченно. Виберемо оптимальну з них. Для цього сумарне відхилення між теоретичними і експериментальними точками повинно бути мінімальним. Це відхилення ми знайдемо за допомогою функції
Метод знаходження мінімального відхилення і є метод найменших квадратів . Це сумарне відхилення залежить від коефіцієнтів а і b функції Y, тому ці коефіцієнти повинні бути мінімальними, тобто похідна функції в цих точках дорівнюють нулю:
Знайшовши приватні похідні і прирівнявши їх нулю, отримаємо таку систему рівнянь
Вирішивши цю систему, ми знайдемо найкращий набір цих параметрів. Ця теоретична крива з параметрами, які визначаються методом найменших квадратів, і буде шуканої лінією - лінією лінійної регресії .
Дослідження параболічної регресії:
У цьому випадку рівняння регресії Y на X має вигляд:
,
де a, b і c - невідомі параметри.
Знайдемо такі p, q, r, при яких парабола найменш ухиляється від точок (X i, Y i). Зробимо це методом найменших квадратів. Для того щоб сума квадратів відхилень
була найменшою, необхідно, щоб виконувалися три умови (по числу невідомих коефіцієнтів)
Після перетворень рівняння приймуть наступний вигляд:
Підставивши відповідні значення в отримані формули, і вирішивши систему рівнянь, ми отримаємо шукану функцію параболічної регресії
Ці формули використовуються для лінійної та параболічної регресій, потім порівнюють отримані результати і знаходять найменші серед отриманих результатів. Та регресія, у якої будуть найменші оцінки, більш точно відображає розподіл точок на діаграмі розсіювання.
3. Обробка вихідних даних
Дана вибірка (обсягу n=100) залежності числа (Y) від числа (X).
Табл. 1. Вихідні дані