О± і ОІ - константи (Теоретично), хоча можуть мінятися від моделі до моделі. p> Передумови для парної регресії:
- X і Y пов'язані лінійно;
- Х - невипадкова змінна з фіксованими значеннями;
- Оµ - помилки нормально розподілені N (0, Пѓ 2 );
-;
-.
На малюнку 3.1 представлена ​​модель парної регресії.
В
Малюнок 3.1 - Модель парної регресії
В
Ці передумови описують класичну лінійну регресійну модель.
Якщо помилка має ненульове середнє, вихідна модель буде еквівалентна нової моделі та іншим вільним членом, але з нульовим середнім для помилки.
Якщо виконуються передумови, то МНК оцінки і є ефективними лінійними незміщеними оцінками
В
Якщо позначити:
В
те що математичне сподівання і дисперсії коефіцієнтів і будуть наступні:
В В В В В В В В
Ковариация коефіцієнтів:
В В
Якщо те і розподілені теж нормально:
В В В В В В
Звідси випливає, що:
- Варіація ОІ повністю визначається варіацією Оµ;
- Чим вище дисперсія X - тим краще оцінка ОІ. br/>
Повна дисперсія визначається за формулою:
В
Дисперсія відхилень у такому вигляді - незміщена оцінка і називається стандартною помилкою регресії. N-2 - може бути інтерпретовано як число ступенів свободи.
Аналіз відхилень від лінії регресії може уявити корисну міру того, наскільки оцінена регресія відображає реальні дані. Хороша регресія та, яка пояснює значну частку дисперсії Y і навпаки погана регресія не відслідковує більшу частину коливань вихідних даних. Інтуїтивно ясно, що всяка додаткова інформація дозволить поліпшити модель, тобто зменшити непоясненим частку варіації Y. Для аналізу регресійній моделі проводять розкладання дисперсії на складові, визначають коефіцієнт детермінації R 2 . p> Відношення двох дисперсій розподілено за F-розподілу, тобто якщо перевірити на статистичну значущість відмінності дисперсії моделі від дисперсії залишків, можна зробити висновок про значущість R 2 . p> Перевірка гіпотези про рівність дисперсій цих двох вибірок:
В В
Якщо гіпотеза Н 0 (про рівність дисперсій декількох вибірок) вірна, t має F-розподіл з (m 1 , m 2 ) = (n 1 -1, n < sub> 2 -1) ступенями свободи. p> Порахувавши F - відношення як відношення двох дисперсій і порівнявши його з табличним значенням, можна зробити висновок про статистичної значущості R 2 /2 /,/19 /.
В
Висновок
В В
Сучасні програми дисперсійного аналізу охоплюють широке коло завдань економіки, біології і техніки та трактуються зазвичай в термінах статистичної теорії виявлення систематичних відмінностей між результатами безпосередніх вимірювань, виконаних за тих чи інших...