Список ключових слів
Модель лінійної регресії, ранговая оцінка параметрів лінійної регресії, оцінка параметрів лінійної регресії за методом найменших квадратів (МНК-оцінка), оцінка параметрів лінійної регресії за методом найменших модулів (МНМ-оцінка), асимптотична відносна ефективність ( АОЕ)
Введення
Об'єктом дослідження в цій ВКР є ранговий метод оцінювання параметрів регресійної моделі. Цей метод застосовується при побудові регресійних моделей поряд з методом найменших квадратів і методом найменших модулів. Предметом дослідження є перевагу застосування рангового методу.
Основні методи досліджень, що використовуються в даній роботі, це методи теорії ймовірностей і математичної статистики, методи комп'ютерного моделювання та методи оптимізації.
Актуальність теми даної ВКР полягає в тому, що оцінки параметрів моделі, отримані за допомогою рангового методу, в деяких випадках є більш точними, ніж МНК- і МНМ-оцінки. Так, наприклад, викиди в даних в меншій мірі впливають на оцінки параметрів моделі, побудовані за допомогою рангового методу, ніж на МНК-оцінки. Причиною цьому є те, що функція втрат для МНК-оцінки включає в себе квадрати відхилень спостережуваних значень залежної величини від її оцінок в рамках моделі, в той час як у функцію втрат рангової моделі ці відхилення входять лінійно. Також варто відзначити випадки, коли шуми в моделях мають двогорбий розподіл - Розподіл з функцією щільності, що має дві точки максимуму. Тоді ефективність МНМ-оцінки параметрів регресії буде нижче в порівнянні з оцінками, отриманими МНК і рангових методом.
У рамках цієї роботи планується виконати наступні завдання:
· розробити і чисельно реалізувати алгоритм побудови рангової оцінки невідомих параметрів регресії;
· змоделювати регресійні залежності з похибками, що мають розподілу з важкими хвостами;
· провести чисельний порівняльний аналіз рангових оцінок з МНК- і МНМ-оцінками;
· обчислити аналітично асимптотическую відносну ефективність рангового методу по відношенню до МНК і МНМ при різних розподілах похибок;
· провести експеримент в порівнянні стійкості рангової, МНК- і МНМ-оцінок параметрів моделі до викидів в реальних даних.
Мета написання цієї ВКР: зробити висновки про застосовності рангового методу в задачі оцінювання параметрів і сформулювати конкретні рекомендації щодо застосування одного з розглянутих трьох методів при різних розподілах шумів.
Отже, структура даної роботи наступна:
· У першому розділі буде розглянуто метод побудови рангової оцінки параметрів моделі.
· У другому розділі будуть розглянуті деякі розподілу випадкових величин, включаючи розподілу з важкими хвостами і двогорбі розподілу, а так само способи їх моделювання. Потім буде проведено чисельний порівняльний аналіз рангових оцінок з МНК і МНМ-оцінками для моделей, шуми яких мають вищезгадані розподілу.
· У третьому розділі будуть обчислені значення асимптотичної відносної ефективності рангової оцінки по відношенню до МНК і МНМ.
· У четвертому розділі буде побудована лінійна регресійна модель на основі реальних даних і проведений експеримент у порівнянні стійкості рангової, МНК- і МНМ-оцінок до викидів.
· У висновку будуть узагальнені отримані в рамках дослідження результати та зроблено висновки щодо ефективності рангового методу оцінки.
1. Ранговий метод
Метод найменших квадратів широко застосовується для оцінки параметрів лінійної регресії, оскільки досить простий в обчисленні і при припущенні про нормальний розподіл шумів в моделі дає оцінку параметрів, збігається з оцінкою максимальної правдоподібності. До недоліків цього методу можна віднести високу чутливість до викидів в даних: навіть одне спостереження з нетиповими значеннями може сильно вплинути на оцінки параметрів і змінити загальну картину. У порівнянні з методом найменших квадратів, метод найменших модулів в меншій мірі піддається впливу викидів в даних, у разі розподілу помилок згідно закону Лапласа (подвійному експоненціальним) він дає оцінку, що забезпечує максимум функції правдоподібності.
Рангове метод оцінки параметрів лінійної регресії є альтернативою двом вищезазначеним методам. Передбачається, що він є більш стійким до викидів в даних і забезпечує більш точну оцінку параметрів регресійної моделі у випадку, коли розподіл шумів в моделі має важкі хвости (наприклад, розподіл Коші), ніж МНК, і краще, ніж МНМ, оцінює значення параметрі...