нтелектуального аналізу даних. Вектори ознак діляться на дві категорії - навчальний набір і тестовий набір. Навчальний набір використовується для навчання алгоритму Data Mining, а тестовий набір - для перевірки знайдених закономірностей.
Завдання, які вирішуються методами Data Mining:
· Класифікація - це віднесення об'єктів до одного з заздалегідь відомих класів.
· Регресія - встановлення залежності безперервних вихідних змінних від вхідних значень.
· Кластеризація - об'єкти всередині кластера повинні бути схожими один на одного і відрізнятися від об'єктів, що увійшли в інші кластери.
· Асоціація - знаходження залежності, що з події X слід подія Y.
· Послідовні шаблони - встановлення закономірностей між пов'язаними в часі подіями.
Можна говорити ще й про завдання аналізу відхилень - виявлення найбільш нехарактерних шаблонів.
Застосування Data Mining в економіці:
· Класифікація - віднесення клієнта до певної групи ризику, оцінка перспективності клієнтів
· Регресія - прогнозування продажів, еластичність попиту
· Кластеризація - сегментація клієнтської бази, аналіз продуктової лінійки
· Асоціація - крос-продажі, стимулювання попиту
· Послідовні шаблони - пророкування попиту, оптимізація закупівель
Розглянемо Data Mining - алгоритми:
Для вирішення вищеописаних задач використовуються різні методи і алгоритми Data Mining. Через те, що Data Mining розвивався і розвивається на стику таких дисциплін, як статистика, теорія інформації, машинне навчання, теорія баз даних, цілком закономірно, що більшість алгоритмів і методів Data Mining були розроблені на основі різних методів з цих дисциплін. Загалом разі, не принципово, яким саме алгоритмом буде вирішуватися одна з 5-ти завдань Data Mining - головне мати метод рішення для кожного класу задач. На сьогодні найбільше поширення отримували самообучающиеся методи і машинне навчання.
5) KDD - інтерпретація
У випадку, коли витягнуті знання непрозорі для користувача, повинні існувати методи постобробки, що дозволяють привести їх до інтерпретованих увазі. Для оцінки якості отриманої моделі потрібно використовувати як формальні методи оцінки, так і знання експерта. Бо саме експерт може сказати, наскільки застосовна отримана модель до реальних даних. Отримані моделі є, по суті, формалізованими знаннями експерта, а отже їх можна тиражувати. Знайдені знання повинні бути застосовні і на нових даних з деякою мірою вірогідності. Використання методів побудови моделей дозволяє отримувати нові знання, які неможливо витягнути іншим способом. Крім того, отримані результати є формалізованим описом якогось процесу, а отже піддаються автоматичній обробці. Недоліком же є те, що такі методи більш вимогливі до якості даних, знань експерта і формалізації самого досліджуваного процесу. До того ж майже завжди є випадки не укладаються ні в які моделі. На практиці подх?? ди комбінуються, наприклад, візуалізація даних наводить експерта на деякі ідеї, які він пробує перевірити за допомогою різних способів побудови моделей, а результати побудови моделей подаються на вхід механізмам візуалізації. Повнофункціональна система аналізу не повинна замикатися на застосуванні тільки одного підходу або однієї методики аналізу. Механізми візуалізації та побудови моделей повинні доповнювати один одного. Максимальну віддачу можна отримати комбінуючи методи і підходи до аналізу даних.
За допомогою KDD вирішуються невеликі бізнес-завдання, наприклад:
· План-факторний аналіз - візуалізація даних;
· Аналіз грошових потоків - візуалізація даних;
· Прогнозування - завдання регресії;
· Управління ризиками - регресія, кластеризація і класифікація;
· Стимулювання попиту - кластеризація, асоціація;
· Оцінка еластичності попиту - регресія;
· Виявлення переваг клієнтів - послідовність, кластеризація, класифікація.
Висновок
Mining (DM) - це технологія підтримки процесу прийняття рішень, заснована на виявлення прихованих закономірностей і систематичних взаємозв'язків між змінними всередині великих масивів інформації, які потім можна застосувати до нових совокупностям даних. При цьому накопичені відомості автоматично узагальнюються до інформації, яка може бути охарактеризована як знання. Виявлення нових знань можна використовувати для підвищення ефективності бізнесу. У зв'язку з удосконал...