неможливо сказати, на якій підставі будуються відповіді.
· існує складність вибору міри близькості (метрики). Від цієї міри головним чином залежить обсяг безлічі записів, які потрібно зберігати в пам'яті для досягнення задовільною класифікації або прогнозу. Також існує висока залежність результатів класифікації від обраної метрики.
· при використанні методу виникає необхідність повного перебору навчальної вибірки при розпізнаванні, наслідок цього - обчислювальна трудомісткість.
· типові завдання даного методу - це завдання невеликий розмірності за кількістю класів і змінних. [5]
7. Метод опорних векторів (SVM - Support Vector Machine)
SVM відображає вектори вхідних даних на більш багатовимірний простір, де будується «оптимальна гіперплоскость», що розділяє дані. З кожного боку від цієї гіперплощини будуються дві паралельні гіперплощини. На Рис. 3 наведено приклад, в якому оптимальна гіперплоскость розділяє дві категорії даних (трикутники і квадрати). Оптимально розділяє гіперплоскость визначає максимальну відстань між двома паралельними гіперплоскостямі. Чим більше відстань між двома гіперплоскостямі, тим точніше модель. Точки даних, що лежать на одній з двох паралельних гіперплоскостей, які визначають найбільшу відстань, називаються опорними векторами. [6]
Рис. 3. - Двомірне уявлення оптимальної гіперплощини, що розділяє дані і опорні вектора
SVM, а також NN і моделі логістичної регресії являють собою потужніуніверсальні методи, які хоча і розрізняються математично, дають в якійсь мірі зіставні результати. [6]
8. Метод дерев рішень
Метод дерев рішень (decision trees) є одним з найпопулярніших методів вирішення задач класифікації та прогнозування. [5]
Якщо залежна змінна приймає безперервні значення, то дерево рішень встановлює залежність цієї змінної від незалежних змінних, тобто вирішує завдання чисельного прогнозування. [5]
Рис. 4. - Дерево рішень Грати чи в гольф? Raquo;
Щоб вирішити завдання, представлену на Рис. 4, тобто прийняти рішення, чи грати в гольф, слід віднести поточну ситуацію до одного з відомих класів (в даному випадку - «грати» або «не грати»). Для даної задачі (як і для будь-якої іншої) може бути побудовано безліч дерев рішень різної якості, з різною прогнозуючої точністю. [5]
9. Кластеризація
модель прогнозування кластеризація вектор
З іншого боку, в тих випадках, коли цільова змінна, або відгук, не має значення або відсутній, дуже популярна технологія кластеризації. [6] Застосування кластеризації, тобто розбиття часового ряду на гомогенні відрізки, в задачах прогнозування було запропоновано давно. Ще в 1974 році Russel Fogler опублікував статтю «A pattern recognition model for forecasting». У цій статті автор вперше запропонував прогнозування часових рядів розбити на два етапи:
· кластеризація
· Прогнозування усередині кластера. [7]
По суті справи такий підхід є комбінацією двох різних моделей часових рядів - перша модель визначає кластер, друга прогнозує усередині кластера. [7]
На Рис. 5 показаний приклад, в якому вхідні дані розділені на дві групи. Дані першої групи позначені зеленими трикутниками, а дані другої групи? червоними квадратами. [6]
Рис. 5. - Двомірне уявлення результату кластеризації набору вхідних даних на групи зелених трикутників і червоних квадратів
Вся мета подібного нагромадження моделей полягає у підвищенні точності прогнозування часових рядів. Однак потрібно чітко розуміти, що створення комбінованих моделей досить трудомістко, тому як потрібно створити не тільки модель для кластеризації, але безліч моделей прогнозування всередині кожного кластера. [7]
10. Метод асоціативних правил
Коли цільова змінна або ступінь подібності не має значення, але важливі зв'язки між вхідними елементами, для їх пошуку може використовуватися так званий метод асоціативних правил. [6]
Вперше завдання пошуку асоціативних правил (association rule mining) була запропонована для знаходження типових шаблонів покупок, що здійснюються в супермаркетах, тому іноді її ще називають аналізом ринкової кошика (market basket analysis). [5]
Хоча всі прогностичні методи мають свої сильні і слабкі сторони, точність моделі значною мірою залежить від вихідних даних і функцій, використовуваних для навчання прогностичної моделі. Як згадувалося вище, побудова моделі значною мірою складається з аналізу даних і маніпулювання ними. Зазвичай з сотень полів доступних вихідних даних вибирається деяка підмножина, і до передачі в метод прогностичного моделювання ці поля попередньо обробляються. ...