Задача 1
У базі даних магазину, який торгує автомобілями, міститься інформація про їх споживчі властивості і ціни.
Для аналізу залежності ціни автомобіля Y від його віку X 1 і потужності двигуна X 2 з бази даних обрані відомості про 16 автомобілях.
Номер автомобіляЦена (тис.. е.) Вік (років) Потужність двигуна (к.с.) 1. Парні залежності
1.1 Побудувати поля розсіювання для ціни Y та віку автомобіля X 1 , а також для ціни Y та потужності двигуна X 2 . На основі їх візуального аналізу висунути гіпотези про вид статистичної залежності Y від X 1 і Y від X 2 і записати їх математично
1.2 Методом найменших квадратів знайти оцінки лінійних рівнянь регресії
,.
1.3 За допомогою коефіцієнтів парної кореляції проаналізувати тісноту лінійного зв'язку між ціною і віком автомобіля, а також між ціною і потужністю двигуна. Перевірити їх значимість з надійністю 0,9
1.4 Перевірити статистичну значущість параметрів і рівнянь регресії з надійністю 0,9
1.5 Побудувати довірчі смуги надійності 0,95 для середнього значення ціни автомобіля залежно від його віку, а також від потужності двигуна. Зобразити графічно лінії регресії і довірчі смуги разом з полями розсіянні
1.6 На продаж надійшла чергова партія однотипних автомобілів. Їх вік 3 роки, потужність двигуна 165 к.с. Розрахувати точковий та інтервальний прогноз середнього значення ціни надійшли автомобілів залежно від віку та потужності двигуна з довірчою ймовірністю 0,95
Рішення
1.1. За вихідними даними побудуємо поля розсіювання змінної у залежно від і. br/>В
Рис. 1.1. Поле розсіяння В«вік-ціна автомобіляВ»
На основі аналізу поля розсіяння (рис. 1.1), можна висунути гіпотезу про наявність зворотного лінійного зв'язку між ціною автомобіля () і його віку (), тобто із збільшенням віку автомобіля ціна на нього зменшується. Залежність описується лінійною моделлю виду:
В
де і - невідомі постійні коефіцієнти, а e - випадкове відхилення, викликане впливом неврахованих факторів і похибками вимірювань.
Аналогічно, на основі аналізу поля розсіяння (рис. 1.2) можна висунути гіпотезу між ціною автомобіля y і потужністю двигуна залежність пряма, тобто із збільшенням потужності двигуна ціна автомобіль зростає. І залежність описується моделлю:
В В
Рис. 1.2 Поле розсіяння В«потужність двигуна-ціна автомобіляВ»
Знайдемо рівняння лінійної регресії
і
невідомі коефіцієнти знаходяться за формулами (використовуючи метод найменших квадратів (МНК)):
,,
Для обчислення оцінок параметрів моделей складаємо допоміжну таблицю 1.1. br/>
Таблиця 1.1. Проміжні розрахунки для оцінок параметрів
№
Підставляючи отримані значення знайдемо оцінки параметрів:
,
Таким чином,
Аналогічно знаходяться оцінки коефіцієнтів моделі
Тоді,
Таким чином,.
1.3 Коефіцієнт парної кореляції знаходиться за формулою:
В
Підставляючи відповідні значення, отримаємо
В
Так як-0, 997 <0, то зв'язок між ознаками зворотна, тобто із зростанням зменшується y. Використовуючи таблицю Чедока при визначаємо, що зв'язок між ознаками сильна. p> Перевіримо значущість коефіцієнта кореляції за допомогою критерію Стьюдента. При рівні значущості 0,9 табличне значення = 1,76. Тоді
В
то істотно відрізняється від 0 і існує сильна лінійна негативний зв'язок між y і.
Аналогічно перевіримо нерівність для:
В
Так як> 0, то зв'язок між ознаками пряма, тобто із зростанням зростає y. Використовуючи таблицю Чедока при 0,952 визначаємо, що зв'язок між ознаками сильна. p> Перевіримо значущість коефіцієнта кореляції за допомогою критерію Стьюдента. При рівні значущості 0,9 табличне значення = 1,76. Тоді
,
значить, істотно відрізняється від 0 і існує сильна лінійна позитивна зв'язок між y і.
1.4 Перевіримо статистичну значущість параметрів і рівнянь регресії з надійністю 0,9 з...