вважається термін В«інтелектуальний аналіз данихВ» (ІАД) [6-9]. p align="justify"> Візуальні інструменти Data Mining дозволяють проводити аналіз даних предметними фахівцями (аналітиками), які не володіють відповідними математичними знаннями.
Існують різні способи отримання інформації про предметну область:
а) Залучення експертного знання. Воно може виражатися, наприклад, в обмеженнях, що накладаються на діапазони змін ознак об'єктів, або ж у формулюванні набору правил для розбиття бази прецедентів на класи (побудова класифікатора).
б) Отримання необхідних знань з набору наявних даних методами видобутку даних (по-англійськи - Data Mining). Сюди відносяться всі методи виявлення відносин у даних, зокрема, кластеризація, регресія, пошук асоціацій. Використання методів видобутку даних може виділити вузьку групу показників, від яких залежить цікавить дослідника характеристика, і представити виявлену закономірність в аналітичній формі.
в) Формування знань на основі навчальної вибірки, представленої експертом (навчання з учителем). Цей спосіб включає в себе обидва перші.
Спочатку в системах виведення за прецедентами в якості джерел фонового знання виступали експерти - висококваліфіковані фахівці предметних областей, а також текстові матеріали - від підручників до протоколів, і, зрозуміло, бази даних (імпліцитні джерела знань). Роль експерта (витратна з ресурсів і часу) полягала у вербалізації, тобто перекладі таких джерел у експліцитну форму. Враховуючи, що найважливішим завданням в процесі формалізації вилучення знань є мінімізація ролі експерта, його роль повинні взяти на себе засоби видобутку даних [6-9]. p align="justify"> Серед видобутих закономірностей на практиці найчастіше зустрічаються відносини еквівалентності і порядку. Перші притаманні, зокрема, задачах класифікації, діагностики та розпізнавання образів. З іншого боку, відносини порядку властиві задачах шкалювання, прогнозування і т.п.
В основі запропонованого підходу лежать інструменти Data Mining, які реалізують дві технології: машинне навчання і візуалізацію (візуальне подання інформації). Якість візуалізації визначається можливостями графічного відображення значень даних. Варіювання графічного представлення шляхом зміни кольорів, форм та інших елементів спрощує виявлення прихованих залежностей.
Ефективність методів машинного навчання в основному визначається їх здатністю досліджувати більшу кількість взаємозв'язків даних, ніж може людина.
Обидві технології доповнюють один одного в процесі здійснення Data Mining-аналізу. Візуалізація використовується для пошуку винятків, загальних тенденцій і залежностей і допомагає в отриманні даних на початковому ета...