17,31248;
,=18,69962.
Використовуючи дані кореляційної таблиці, побудуємо гістограми, полігони та графіки емпіричних функцій розподілу для X і Y (див. рис. 2 - рис. 7):
Рис. 2. Гістограма відносних частот по X
Рис. 3. Гістограма відносних частот по Y
Рис. 4. Полігон відносних частот по X
Рис. 5. Полігон відносних частот по Y
Рис. 6. Емпірична функція розподілу по X
Рис. 7. Емпірична функція розподілу по Y
5. Регресійний аналіз
Лінійна регресія
Для знаходження коефіцієнтів a і b метод найменших квадратів були пораховані наступні необхідні параметри:
=11473,98048;
=919,47;
=38067,15706;
=3164,05.
У нашому випадку коефіцієнти а і b відповідно рівні:
,.
Отже, перше рівняння лінійної регресії для нашої вибірки має вигляд:
y=x.
Для знаходження коефіцієнтів с і d методом найменших квадратів були пораховані наступні необхідні параметри:
=130669,13150;
=919,47;
=38067,15706;
=3164,05.
У нашому випадку коефіцієнти c і d відповідно рівні:
,.
Отже, друге рівняння лінійної регресії для нашої вибірки (див. рис. 8) має вигляд:
x=0,29424 y - 0,09047.
Рис. 8. Лінійна регресія
Параболічна регресія
Для знаходження коефіцієнтів p, q і r методом найменших квадратів були пораховані наступні необхідні параметри:
+2575510,37568;
165006,98099;
=11473,98048;
+538674,01185;
=919,47;
=38067,15706;
=3164,05.
У нашому випадку коефіцієнти p, q і r відповідно рівні:
,,.
Отже, рівняння параболічної регресії для нашої вибірки (див. рис. 9) має вигляд:
.
Рис. 9. Параболічна регресія
Таким чином, ми з'ясували, що:
. Залежність між X і Y близька до лінійної.
. Залежність між X і Y близька до квадратичної.
. При цьому обидві криві - пряма і парабола - практично не відхиляються від точок вибірки (X, Y), але все-таки точніше вибірку описує параболічна регресія.
Теоретично стверджувалося, а тепер підтвердилося на практиці, що чим більше ступінь рівняння регресії, тим точніше графік. Це легко помітити на малюнках. Але трудність обчислень зростає неймовірно; якщо, щоб знайти рівняння лінійної регресії доводилося вирішувати систему з двох рівнянь, що включають неприємні суми, то для параболічної - уже з трьох, для кубічної - з чотирьох.
Для даної вибірки існує закономірність; в рівняннях регресій, у міру зростання ступеня рівнянь n, коефіцієнти перед змінними в цьому ступені прагнуть до нуля. Це дозволяє зробити висновок, що побудова регресій вищих ступенів не дало б нам відчутного поліпшення результату.
Розглянемо статистику, яка показує відхилення значень від
. <...