пі проекту. Машинне навчання використовується пізніше для пошуку залежностей у вже налагодженому проекті. p align="justify"> Машинне навчання передбачає використання різних методів, наприклад: дерев рішень; асоціативних правил; генетичних алгоритмів; нейронних мереж.
Дерева рішень призначені для класифікації даних, вони використовують вагові коефіцієнти для розподілу елементів даних на все більш і більш дрібні групи. Метод асоціативних правил класифікує дані на основі набору правил, подібних правилами в експертних системах. Ці правила можна генерувати, використовуючи процес пошуку та перевірки комбінацій правил, або витягувати правила з дерев рішень. У нейронних мережах знання представлені у вигляді зв'язків, що з'єднують набір вузлів. Сила зв'язків визначає залежності між факторами даних. p align="justify"> У табл. 2.1. наведено короткий опис основних алгоритмів Data Mining . Кожен з методів має свої переваги і недоліки [8-9].
Перевага дерев рішень та асоціативних правил полягає в їх читабельності - вони схожі на пропозиції на природній мові. Однак при великій кількості факторів даних буває дуже складно зрозуміти сенс такого подання. Недолік: вони не призначені для широких числових інтервалів. Це пов'язано з тим, що кожне правило або вузол в дереві рішень представляє одну зв'язок (залежність, відношення). Щоб уявити залежності для великого інтервалу значень буде потрібно дуже багато правил або вузлів. p align="justify"> Перевага нейронних мереж в компактному поданні числових відносин для широкого діапазону значень. А недолік - в складності інтерпретації. br/>
Таблиця 2.1 - Основні алгоритми Data Mining
АлгоритмОписаниеАссоциативные правілаВиявляют причинно наслідкові зв'язки і визначають ймовірності або коефіцієнти достовірності, дозволяючи робити відповідні висновки. Правила представлені у формі В«якщо <умови>, то <висновок>В». Їх можна використовувати для прогнозування або оцінки невідомих параметрів (значень). Дерева рішень і алгоритми классіфікацііОпределяют природні В«розбивкиВ» в даних, засновані на цільових змінних. Спочатку виконується розбивка по найбільш важливих змінним. Гілка дерева можна представити як умовну частину правила. Найбільш часто зустрічаються прикладами є алгоритми класифікаційних і регресійних дерев (Classification and regression trees, CART) або хі-квадрат індукція (Chi-squared Automatic Induction, CHAID). Штучні нейронні сетіЗдесь для передбачення значення цільового показника використовується набори вхідних змінних, математичних функцій активації і вагових коефіцієнтів вхідних параметрів. Виконується ітеративний навчальний цикл, нейронна мережа модифікує вагові коефіцієнти до тих пір, поки що передбачається вихідний параметр відповідає дійсному значенню. Після навчання нейронна мережа стає моделлю, яку можна застосувати д...