чної обробки даних (OLAP) в Data Mining тягар формулювання гіпотез і виявлення незвичайних (unexpected) шаблонів перекладено з людини на комп'ютер. Data Mining - це не один, а сукупність великого числа різних методів виявлення знань. Вибір методу часто залежить від типу наявних даних і від того, яку інформацію ви намагаєтеся отримати. Ось, наприклад, деякі методи: асоціація (об'єднання), класифікація, кластеризація, аналіз часових рядів і прогнозування, нейронні мережі і т. д.
Розглянемо властивості виявляються знань, дані у визначенні, більш докладно.
Знання повинні бути нові, раніше невідомі. Витрачені зусилля на відкриття знань, які вже відомі користувачеві, не окупаються. Тому цінність представляють саме нові, раніше невідомі знання. p align="justify"> Знання повинні бути нетривіальні. Результати аналізу повинні відображати неочевидні, несподівані закономірності в даних, що становлять так звані приховані знання. Результати, які могли б бути отримані більш простими способами (наприклад, візуальним переглядом), не виправдовують залучення потужних методів Data Mining. p align="justify"> Знання повинні бути практично корисні. Знайдені знання повинні бути застосовні, в тому числі і на нових даних, з досить високим ступенем вірогідності. Корисність полягає в тому, щоб ці знання могли принести певну вигоду при їх застосуванні. p align="justify"> Знання повинні бути доступні для розуміння людині. Знайдені закономірності повинні бути логічно з'ясовні, в іншому випадку існує ймовірність, що вони є випадковими. Крім того, виявлені знання повинні бути представлені в зрозумілому для людини вигляді. p align="justify"> У Data Mining для представлення отриманих знань служать моделлю. Види моделей залежать від методів їх створення. Найбільш поширеними є: правила, дерева рішень, кластери та математичні функції. p align="justify"> Сфера застосування Data Mining нічим не обмежена - Data Mining потрібен скрізь, де є будь-які дані. Досвід багатьох таких підприємств показує, що віддача від використання Data Mining може досягати 1000%. Наприклад, відомі повідомлення про економічний ефект, в 10-70 разів перевищило початкові витрати від 350 до 750 тис. дол. Наводяться відомості про проект в 20 млн. дол., Який окупився всього за 4 місяці. Інший приклад - річна економія 700 тис. дол. за рахунок впровадження Data Mining в мережі універсамів у Великобританії. Data Mining становлять велику цінність для керівників та аналітиків в їх повсякденній діяльності. Ділові люди усвідомили, що за допомогою методів Data Mining вони можуть отримати відчутні переваги в конкурентній боротьбі. br/>
2. Класифікація задач DataMining
Методи DataMining дозволяють вирішити багато завдань, з якими стикається аналітик. З них основними є: класифікація, регресія, пошук асоціативних правил і кластеризація. Нижче наведено короткий оп...