n="justify">.
В експериментах випадкова величина з трикутним розподілом на відрізку від - 1 до 1 обчислюється як сума двох випадкових величин, кожна з них розподілена рівномірно на відрізку від - 0,5 до 0,5. На малюнку 2.6 зображена щільність трикутного розподілу.
ранговий регресія асимптотический похибка
Рис. 2.6. Графік щільності трикутного розподілу
двогорбий розподіл на основі двох трикутних (на відрізках. [- b, -a] і [a, b]) має щільність
.
В експериментах один трикутник розташовується на відрізку [- 1,0], а другий - на відрізку [0,1]. Такий розподіл моделюється наступним чином: з імовірністю 0,5 генерується сума двох величин з рівномірним розподілом на відрізку від 0 до 0,5, інакше генерується сума двох величин з рівномірним на відрізку від - 0,5 до 0 розподілом. Графік щільності такого розподілу представлений на малюнку 2.7.
Рис. 2.7. Графік щільності двогорбої розподілу на основі комбінації двох трикутних
Логістичне розподіл з параметрами зсуву? і масштабу s gt; 0 має функцію розподілу виду. В експериментах така величина з параметрами? =0 і s=1 моделюється за допомогою функції, зворотної функції розподілу, в яку в якості аргументу підставляється випадкова величина з рівномірним на відрізку від 0 до 1 розподілом. На малюнку 2.8 зображено графік щільності цього розподілу.
Рис. 2.8. Графік щільності логістичного розподілу
Для проведення порівняльного аналізу потрібно побудувати регресійні залежності. В експериментах розглядаються моделі з n=50 спостереженнями і (m+1)=3 параметрами, включаючи вільний член. Дані генеруються таким чином:
· Спочатку випадковим чином генерується матриця X з даними, рівномірно розподіленими на деякому відрізку. Матриця має n рядків і m стовпців.
· До матриці X приписується стовпець з одиниць для того, щоб будувати моделі з вільним членом.
· Згідно розглянутого розподілу генерується n - мірний вектор-стовпець похибок?.
· Задається m-мірний вектор-стовпець? з реальними значеннями параметрів лінійної регресійної моделі.
· Будується вектор спостережень Y=X? +?
Для кожної побудованої регресійної залежності в експериментах обчислюються ранговая, МНК- і МНМ-оцінки вектора її параметрів.
Згідно Дж. Себеріо, МНК-оцінка вектора параметрів лінійної регресійної моделі має вигляд
.
Для побудови наближеної МНМ-оцінки використовується метод симплексного пошуку з метою мінімізації функції втрат
.
Для побудови наближеної рангової оцінки тим же методом проводиться мінімізація розглянутої в попередньому розділі функції втрат
.
Оскільки дані генеруються випадково, то слід уникати впливу якогось конкретного розкиду даних на загальну картину. Тому для одного і того ж значення заданих параметрів дані генеруються 1000 раз у проведених експериментах, щоразу на основі цих даних будуються оцінки параметрів, обчислюються значення критерію якості оцінок, і потім вважається вибіркове середнє якості оцінок параметрів регресійних моделей для кожного методу. Критерієм якості оцінки в цьому випадку буде виступати сума квадратів різниць істинного значення параметра і його оцінки, де - вектор з істинними значеннями параметрів, - вектор з оцінками параметрів. Найкращим буде той метод, для якого вибіркове середнє помилки оцінювання буде менше. Результати проведених експериментів для зручності зведені в таблицю 2.1. З цих даних слідують наступні висновки:
· МНК найбільш точний для оцінювання параметрів регресійної моделі з шумами, що мають розподіл Гауса, Стьюдента з 13 і більше ступенями свободи, двогорбий розподіл на основі гауссовских величин, трикутний розподіл, а так само двогорбий розподіл на основі трикутного. Цей метод дає найгіршу оцінку при розподілі Лапласа, Коші, Тьюки і Стьюдента з менш ніж 5 ступенями свободи.
· МНМ дає найбільш точну оцінку при шумах в моделі, що мають розподіл Коші і оцінку, зіставну по точності з рангової, при розподілі Лапласа. Цей метод в меншій мірі точний, ніж розглянуті альтернативи, при розподілі Гаусса, розподілі Стьюдента з 5 і більше ступенями свободи, двогорбий розподілі на основі гауссовских величин, трикутному розподілі, а так само двогорбий розподілі на основі трикутного.
· Рангове метод найбільш точний для оцінювання параметр...