о нових даними з метою прогнозирования.Генетические алгорітмиЕтот метод використовує ітеративний процес еволюції послідовності поколінь моделей, що включає операції відбору, мутації і схрещування. Для відбору певних особин і відхилення інших використовується В«функція пристосованостіВ» (fitness function). Генетичні алгоритми в першу чергу застосовуються для оптимізації топології нейроннихГенетіческіе алгорітмисетей і ваг. Однак, їх можна використовувати і самостійно, для моделірованія.Кластерний аналізПодразделяет гетерогенні дані на гомогенні або полугомогенние групи. Метод дозволяє класифікувати спостереження за низкою загальних ознак. Кластеризація розширює можливості прогнозірованія.Вивод шляхом зіставлення (Memory-Based Reasoning, Mbr) або висновок, заснований на прецедентах (Case-Based Reasoning, Cbr) Ці алгоритми грунтуються на виявленні деяких аналогій у минулому, найбільш близьких до поточної ситуації, з тим, щоб оцінити невідоме значення або передбачити можливі результати (наслідки).
Існує широкий спектр інструментів для підтримки проектів Data Mining. До них ставляться як загальнодоступні алгоритми візуалізації та машинного навчання, так і складні програмні пакети, де використовуються обидві стратегії, що працюють на паралельних процесорах. Вартість останніх може досягати декількох сотень тисяч доларів. Пошук найкращого інструменту для Data Mining рішення залежить від ряду умов, таких як мета проекту (наприклад, аналіз споживчого кошика) і розмір досліджуваної бази даних. При виборі інструментів та алгоритмів дуже важлива гнучкість, оскільки залежно від вибору стратегії може бути отриманий різний результат [8-9]. p align="justify"> Для аналізу природного середовища в даний час широко застосовуються методи, що отримали в літературі назву інтелектуального аналізу даних (ІАД), цьому російському поняттю відповідають англійські терміни Data Mining (видобуток даних), On line Analytical Processing, OLAP ( оперативний аналіз даних), Knowledge Discovery (виявлення знань) або Intelligent Analysis Data (розвідувальний аналіз даних). Термін ІАД здається дещо рекламним. Методи ІАД навряд чи більше В«інтелектуальніВ», ніж методи, що застосовуються в інших розділах програмного забезпечення, але оскільки термін устоявся, будемо його використовувати. У табл. 2.1. наведено короткий опис основних алгоритмів Data Mining [8-9] .
2.1 ЗАВДАННЯ пошуку асоціативних правил
Асоціація - це одне із завдань Data Mining. Метою пошуку асоціативних правил (association rule) є знаходження закономірностей між пов'язаними подіями в базах даних [10-16]. p align="justify"> Дуже часто покупці купують не один товар, а декілька. У більшості випадків між цими товарами існує взаємозв'язок. Так, наприклад, покупець, що придбає лак для нігтів, швидше за все, захоче придбати також засіб для зняття лаку. Ця інф...