х, і що зустрічаються в них помилки і аномальні значення намагається інтерпретувати як частина внутрішньої структури даних. Очевидно, що така модель буде некоректно працювати надалі з іншими даними, де характер помилок буде дещо іншою. Терміном underfitting позначають ситуацію, коли занадто велике кількість помилок при перевірці класифікатора на навчальній множині. Це означає, що особливих закономірностей в даних не було виявлено і або їх немає взагалі, або необхідно вибрати інший метод їх виявлення. br/>
4. Завдання пошуку асоціативних правил
Пошук асоціативних правил є одним з найпопулярніших додатків Data Mining. Суть завдання полягає у визначенні часто зустрічаються наборів об'єктів, великий збір таких наборів. Дана задача є окремим випадком задачі класифікації. Спочатку вона вирішувалася при аналізі тенденцій в поведінці покупців у супермаркетах. Аналізу піддавалися дані про скоєних ними покупках, які покупці складають у візок (кошик). Це послужило причиною другого часто зустрічається назви - аналіз ринкових кошиків (Basket Analysis). При аналізі цих даних інтерес насамперед представляє інформація про те, які товари купуються разом, в якій послідовності, які категорії споживачів, які товари воліють, в які періоди часу і т. п. Така інформація дозволяє більш ефективно планувати закупівлю товарів, проведення рекламної кампанії і т. д.
Наприклад, із набору покупок, що здійснюються в магазині, можна виділити наступні набори товарів, які купуються разом:
{чіпси, пиво};
{вода, горіхи}.
Отже, можна зробити висновок, що якщо купуються чіпси або горіхи, то, як правило, купуються пиво або вода відповідно. Володіючи такими знаннями, можна розмістити ці товари поруч, об'єднати їх в один пакет зі знижкою або вжити інших дії, що стимулюють покупця придбати товар. p align="justify"> Завдання пошуку асоціативних правил актуальна не тільки в сфері торгівлі. Наприклад, у сфері обслуговування інтерес представляє, якими послугами клієнти воліють користуватися в сукупності. p align="justify"> Для отримання цієї інформації завдання вирішується стосовно до даних про послуги, якими користується один клієнт протягом певного часу (місяця, року). Це допомагає визначити, наприклад, як найбільш вигідно скласти пакети послуг, пропонованих клієнту. p align="justify"> У медицині аналізу можуть піддаватися симптоми і хвороби, які спостерігаються у пацієнтів. У цьому випадку знання про те, які поєднання хвороб і симптомів зустрічаються найбільш часто, допомагають у майбутньому правильно ставити діагноз. p align="justify"> При аналізі часто викликає інтерес послідовність подій, що відбуваються. При виявленні закономірностей у таких послідовностях можна з деякою часткою ймовірності передбачати появу подій у майбутньому, що дозволяє приймати більш правильні рішення. Таке з...