исла найбільш потужних, розвинених і універсальних моделей прогнозування відносяться регресійні моделі. Регресія - це технологія статистичного аналізу, метою якої є визначення кращої моделі, яка встановлює взаємозв'язок між вихідний (залежної) змінної і набором вхідних (незалежних) змінних. [3 стор. 537]
Застосування регресійних моделей виявляється особливо корисним у таких випадках:
· вхідні змінні завдання відомі або легко піддаються зміні, а вихідні - ні;
· значення вхідних змінних відомі спочатку, і на їх основі потрібно передбачити значення вихідних змінних;
· потрібно встановити причинно-наслідкові зв'язки між вхідними і вихідними змінними також в силу цих зв'язків. [3 стор. 537-538]
У технологіях прогнозування найбільш широко використовується такий вид регресійної моделі, як узагальнена лінійна модель. Її популярність викликана тим, що багато процесів в управлінні, економіці та бізнесі лінійні по своїй природі. Крім того, існують методи, які дозволяють привести нелінійну модель з мінімальними втратами точності. [3 стор. 358]
Узагальнена лінійна модель регресії описується наступним рівнянням:
=? 0+? 1x1 +? 2x2 + ... +? nxn,
де xi - значення i-го спостереження,? i - коефіцієнт регресії. [3 стор. 538]
Логістична регресія - це різновид множинної регресії, загальне призначення якої полягає в аналізі зв'язку між декількома незалежними змінними (званими також регресорів або предикторами) і залежною змінною. Бінарна логістична регресія, як випливає з назви, застосовується у випадку, коли залежна змінна є бінарною (тобто може приймати тільки два значення). [4]
5. Метод декомпозиції часового ряду
Одним з методів прогнозування часових рядів є визначення факторів, які впливають на кожне значення часового ряду. Для цього виділяється кожна компонента часового ряду, обчислюється її внесок в загальну складову, а потім на його основі прогнозуються майбутні значення часового ряду. Даний метод отримав назву декомпозиції часового ряду. [3 стор. 538]
Фактично декомпозиція - це виділення компонент часового ряду і їх проекція на майбутнє з подальшою комбінацією для отримання прогнозу. Проблема полягає в тому, щоб забезпечити достатньо високу точність для окремих компонент дуже скрутно. [3 стор. 538]
При декомпозиції за допомогою лінійного тренду, що типово для багатьох реальних часових рядів, він являє собою пряму лінію, описувану рівнянням:
=a + b? x,
де y - значення ряду, a, b-коефіцієнти, що визначають розташування і нахил лінії тренду, t - час. [3 стор. 538]
Якщо рівняння лінії тренду відомо, з його допомогою можна розрахувати значення тренда в будь-який, зокрема майбутній, момент часу. Досить скористатися рівнянням:
i + k=a + b? (t + k),
де t - початок прогнозу, k -горізонт прогнозу. [3 стор. 538]
При використанні сезонності для прогнозування методом декомпозиції спочатку з часового ряду забирається тренд і згладжується можлива циклічна компонента. Тоді можна вважати, що залишилися дані будуть обумовлені в основному сезонними коливаннями. На основі цих даних обчислюються так звані сезонні індекси, які характеризують зміни часового ряду в часі. [3 стор. 538]
6. Метод «найближчого сусіда» (NN - nearest neighbor) або системи міркувань на основі аналогічних випадків
Метод найближчого сусіда відноситься до класу методів, робота яких грунтується на зберіганні даних у пам'яті для порівняння з новими елементами. При появі нового запису для прогнозування знаходяться відхилення між цим записом і подібними наборами даних, і найбільш подібна (або ближній сусід) ідентифікується. [5]
Прецедент - це опис ситуації в поєднанні з детальним зазначенням дій, що вживаються в даній ситуації. Таким чином, висновок, заснований на прецедентах, являє собою такий метод аналізу даних, який робить висновки щодо даної ситуації за результатами пошуку аналогій, що зберігаються в базі прецедентів. Даний метод за своєю суттю відноситься до категорії навчання без учителя raquo ;, тобто є самонавчальної технологією, завдяки чому робочі характеристики кожної бази прецедентів з плином часу і накопиченням прикладів поліпшуються. [5]
Переваги методу:
· простота використання отриманих результатів.
· рішення не унікальні для конкретної ситуації, можливо їх використання для інших випадків.
· метою пошуку є не гарантовано вірне рішення, а краще з можливих. [5]
Недоліки методу найближчого сусіда :
· даний метод не створює будь-яких моделей або правил, узагальнюють попередній досвід, - у виборі рішення вони ґрунтуються на всьому масиві доступних історичних даних, тому...