пні позначення:
- число елементів у змінної X або в переменнойY
- сума всіх елементів змінної X
- сума всіх елементів змінної Y
- твір всіх елементів змінної Y один на одного
- твір всіх елементів змінної Y один на одного
-попарне твір всіх елементів змінної X на відповідні елементи змінної Y
Для застосування методу лінійного регресійного аналізу необхідно дотримуватися таких умов:
. Порівнювані змінні X і Y повинні бути виміряні в шкалі інтервалів або відносин. p>. передбачається, що змінні X і Y мають нормальний закон розподілу.
. Число варьирующих ознак у порівнюваних змінних має бути однаковим. br/>
.2 Нелінійне рівняння регресії
Найпростіші випадки парної нелінійної кореляційної залежності - це гіперболічна і параболічна. Їх рівняння мають вигляд:
(14) (15)
Як і у випадку лінійної залежності, параметри знаходяться методом найменших квадратів, який дає такі системи нормальних рівнянь:
для гіперболічної залежності (16)
для параболічної залежності (17)
Параметри, знаходимо вирішуючи ці системи нормальних рівнянь.
Тіснота взаємозв'язку між ознаками в нелінійній залежності вимірюється за допомогою кореляційного відношення, що розраховується за формулою
(18)
де - Загальна дисперсія ознаки У; - межгрупповая дисперсія ознаки У.
Загальна дисперсія результативної ознаки У складається з двох дисперсій: міжгруповий і внутрішньогрупової, тобто . p> Міжгрупова дисперсія характеризує варіацію ознаки У за рахунок врахованого фактора, а внутригрупповая дисперсія - за рахунок неврахованих факторів
(19)
(20)
де - значення ознаки
- умовна середня ознаки;
- загальна середня ознаки Y;
- частота значень ознаки Y;
- частота значень ознаки X;
n - обсяг вибірки (сума всіх частот).
Корреляционное відношення змінюється від 0 до 1, тобто . Чим ближче до 0, тим слабкіше зв'язок між результативною ознакою У і врахованим фактором Х.
За допомогою кореляційного відносини можна оцінити тісноту взаємозв'язку між ознаками і в разі лінійної залежності, тому що у разі лінійної залежності.
- коефіцієнт детермінації, що показує на скільки відсотків в середньому варіація результативної ознаки пояснюється за рахунок варіації врахованого факторного ознаки.
В§ 3. Множинний кореляційно - регресійний аналіз
Кореляційна взаємозв'язок між трьома і більше ознаками (показниками) називається множинної кореляційної залежністю. Під множинної кореляційної залежності вирішуються ті ж завдання, що і в парній, а саме: оцінюється тіснота взаємозв'язку між ознаками (кореляційний аналіз), визначається аналітичний вираз цього взаємозв'язку наближено у вигляді рівняння регресії (регресійний аналіз). Але у множині регресійному аналізі попередньо вирішується ще одне завдання - відбір факторних ознак в рівняння регресії (регресійна модель). При відборі факторних ознак у регресійну модель необхідно враховувати наступні умови:
1) в модель вводяться факторні ознаки, що роблять сильний вплив на результативну ознаку;
2) факторні ознаки, що вводяться в модель, повинні бути лінійно незалежними або мати слабку зв'язок між собою.
Якщо при аналізі успішності навчання підлітків розглядати різні незалежні змінні, що впливають, з точки зору дослідника, на результативну ознаку, то в цьому випадку можна побудувати лінійне рівняння множинної регресії, в яке будуть входити всі розглянуті змінні. У загальному випадку, залежність між кількома змінними величинами висловлюють рівнянням множинної регресії, яка може бути як лінійною, так і не лінійною. У простому випадку множинна лінійна регресія виражається рівнянням з двома незалежними змінними величинами X і Z і має наступний вигляд:
(21)
де a - вільний член, b і c - параметри рівняння (21).
Рівняння (21) може вирішуватися щодо залежною змінною Z, тоді X і Y є незалежними змінними, і рівняння множинної регресії має наступний вигляд
(22)
Можна вирішити рівняння (21) і відносно X, тоді Z і Y будуть незалежними змінними, а рівняння буде мати такий вигляд
(23)
При проведенні конкретних розрахунків вибір залежних і незалежних змінних визначається планом експерименту.
Рішення рівнянь (21), (22), (23) полягає в тому, що знаходяться величини a, b, c на основі рішення системи з трьох рівнянь.
Для рішення рівняння (21) система має наступний вигляд
(24)
Для рішення рівняння (22) система буде виглядати наступним чином