жна транзакція перевіряється на наявність великих наборів, виявлених при попередньому проході. Відповідно, нові набори формуються шляхом розширення наявних наборів. Цей алгоритм неефективний, оскільки генерує і враховує занадто багато наборів-кандидатів, які недостатньо великі (нечасті). br/>
2.3.2 АЛГОРИТМ SETM
Створення цього алгоритму було мотивоване бажанням використовувати мову SQL для обчислення часто зустрічаються наборів товарів. Як і алгоритм AIS, SETM також формує кандидатів В«на льотуВ», грунтуючись на перетвореннях бази даних. Щоб використовувати стандартну операцію об'єднання мови SQL для формування кандидата, SETM відокремлює формування кандидата від їх підрахунку [14-16]. p align="justify"> Незручність алгоритмів AIS і SETM? зайве генерування і підрахунок занадто багатьох кандидатів, які в результаті не надаються часто зустрічаються. Для поліпшення їх роботи був запропонований алгоритм Apriori. p align="justify"> Робота даного алгоритму складається з декількох етапів, кожен з етапів складається з наступних кроків:
а) формування кандидатів;
б) підрахунок кандидатів.
Формування кандидатів (candidate generation)? етап, на якому алгоритм, скануючи базу даних, створює безліч i -елементних кандидатів ( i - номер етапу). На цьому етапі підтримка кандидатів не розраховується.
Підрахунок кандидатів (candidate counting)? етап, на якому обчислюється підтримка кожного i -елементного кандидата. Тут же здійснюється відсікання кандидатів, підтримка яких менше мінімуму, встановленого користувачем (min_sup). Решта i -елементні набори називаємо часто зустрічаються.
Розглянемо роботу алгоритму Apriori на прикладі бази даних D. Ілюстрація роботи алгоритму наведена на малюнку 2.1. Мінімальний рівень підтримки дорівнює 3. br/>В В
Малюнок 2.1 - Алгоритм Apriori
На першому етапі відбувається формування одноелементних кандидатів. Далі алгоритм підраховує підтримку одноелементних наборів. Набори з рівнем підтримки менше встановленого, тобто 3, відсікаються. У нашому прикладі це набори e і f , які мають підтримку, рівну 1. Решта набори товарів вважаються часто зустрічаються одноелементними наборами товарів: це набори a, b, c, d . p>
Далі відбувається формування двое...