Таким чином, дисперсія випадкових залишків буде дорівнює:
Ми справили обчислення, і побудували регресійне рівняння, що дозволяє нам побудувати якусь оцінку змінної у (цю оцінку ми позначили?). Однак, якби ми взяли інші дані, по іншим областям (або за інший період часу), то вихідні, експериментальні значення х і у у нас були б іншими і, відповідно, а і b, швидше за все, вийшли б іншими.
1.5 Основні припущення регресійного аналізу
Основні припущення регресійного аналізу відносяться до випадкової компоненті? і мають вирішальне значення для правильного і обгрунтованого застосування регресійного аналізу в економетричних дослідженнях.
У класичній моделі регресійного аналізу передбачаються виконаними наступні припущення (умови Гаусса-Маркова):
Умова 1.5.1. Величини? i є випадковими.
Умова 1.5.2. Математичне сподівання збурень одно ну -
лю: E ()=0.
Умова 1.5.3. Обурення і? j некорреліровани: E ()=0, i? j.
Умова 1.5.4. Дисперсія обурення постійна для кожного i: D () =? 2. Ця умова називається умовою гомоскедастичність. Порушення цієї умови називається гетероскедастичності.
Умова 1.5.5. Величини? i взаємно незалежні зі значеннями пояснюють змінних.
Тут, у всіх умовах i=1,2, K, n.
Ці припущення утворюють першу групу припущень, необхідних для проведення регресійного аналізу в рамках класичної моделі.
Друга група припущень дає достатні умови для обгрунтованого проведення перевірки статистичної значущості емпіричних регресій:
Умова 1.5.6. Спільний розподіл випадкових величин, K, є нормальним.
При виконанні припущень першої та другої груп випадкові величини, K, виявляються взаємно незалежними, однаково розподіленими випадковими величинами, котрі підпорядковуються нормальному розподілу з нульовим математичним очікуванням і дисперсією? 2.
1.6 Характеристика оцінок коефіцієнтів рівняння регресії
) математичне очікування
Теорема: М (а) =, M (b)=- незміщене оцінок
Це означає, що при збільшенні кількості спостережень значення МНК-оцінок a і b будуть наближатися до істинним значенням і;
) дисперсія
Теорема:
;
Завдяки цій теоремі, ми можемо отримати уявлення про те, як далеко, в середньому, наші оцінки a і b знаходяться від істинних значень і.
Необхідно мати на увазі, що дисперсії характеризують не відхилення, а відхилення в квадраті raquo ;. Щоб перейти до порівнянним значенням, розрахуємо стандартні відхилення a і b:
;
Будемо називати ці величини стандартними помилками a і b відповідно.
1.7 Побудова довірчих інтервалів
Нехай ми маємо оцінку а. Реальне значення коефіцієнта рівняння регресії лежить десь поруч, але де точно, ми дізнатися не можемо. Однак, ми можемо побудувати інтервал, в який це реальне значення потрапить з деякою ймовірністю. Доведено, що:
з імовірністю Р=1 -
де/2 (n - 1) -/2-відсоткова точка розподілу Стьюдента з (n - 1) ступенями свободи - визначається зі спеціальних таблиць.
При цьому рівень значимості встановлюється довільно.
Нерівність можна перетворити таким чином:
,
або, що те ж саме:
Аналогічно, з імовірністю Р=1 -:
звідки треба:
,
або:
Рівень значимості - це ймовірність того, що насправді істинні значення і лежать за межами побудованих довірчих інтервалів. Чим менше його значення, тим більше величина t/2 (n - 1), відповідно, тим ширше буде довірчий інтервал.
1.8 Перевірка статистичної значущості коефіцієнтів регресії
Ми отримали МНК-оцінки коефіцієнтів, розрахували для них довірчі інтервали. Однак ми не можемо судити, чи не занадто широкі ці інтервали, чи можна взагалі говорити про значущість коефіцієнтів регресії.
Гіпотеза Н0: припустимо, що=0, тобто насправді незалежної постійної складової у відгуку немає (альтернатива - гіпотеза Н1: 0).
Для перевірки цієї ...