lign="justify"> Дерева рішень є прекрасним інструментом в системах підтримки прийняття рішень, інтелектуального аналізу даних (data mining).
До складу багатьох пакетів, призначених для інтелектуального аналізу даних, вже включені методи побудови дерев рішень. В областях, де висока ціна помилки, вони послужать відмінною підмогою аналітика або керівника
В· Дерева рішень успішно застосовуються для вирішення практичних завдань у наступних областях:
В· Банківська справа. Оцінка кредитоспроможності клієнтів банку при видачі кредитів.
В· Промисловість. Контроль за якістю продукції (виявлення дефектів), випробування без руйнувань (наприклад перевірка якості зварювання) і т.д.
В· Медицина. Діагностика різних захворювань.
В· Молекулярна біологія. Аналіз будови амінокислот.
дерево рішення класифікація управлінський
Це далеко не повний список областей де можна використовувати дерева рішень. Не досліджені ще багато потенційних області застосування. p align="justify"> На сьогоднішній день існує значне число алгоритмів, що реалізують побудова дерев рішень, з яких найбільше поширення і популярність отримали наступні:
В· CART (Classification and Regression Tree), розроблений Л. Брейманом з співавторами [Breiman et al., 1984], являє собою алгоритм побудови бінарного дерева рішень - дихотомічної класифікаційної моделі; кожен вузол дерева при розбитті має тільки двох нащадків; як видно з його назви, алгоритм вирішує завдання як класифікації, так і регресії;
В· C4.5 - алгоритм побудови дерева рішень з необмеженою кількістю нащадків у вузла, розроблений Р. Куінленом [Quinlan, 1993]; не вміє працювати з безперервним цільовим полем, тому вирішує тільки завдання класифікації;
В· QUEST (Quick, Unbiased, Efficient Statistical Trees) - програма, розроблена В. Ло та І. Ши [Loh, Shih, 1997], в якій використовуються поліпшені варіанти методу рекурсивного квадратичного дискримінантного аналізу, що дозволяють реалізувати багатовимірне розгалуження за лінійним комбінаціям порядкових предикторів; містить ряд нових засобів для підвищення надійності та ефективності індукованих дерев класифікації.
Завдання
Компанія вирішує питання про надання нового продукту на загальнонаціональний ринок. Невизначеність полягає в тому, як відреагує ринок на новий продукт. Розглядається питання про апробацію нового продукту спочатку на деякій регіональному ринку. Таким чином, початкове рішення, яке необхідно прийняти компанії - це чи проводити первинний маркетинг продукту на регіональному рівні. p align="justify"> Компанія припускає, що вихід на регіональний рівень зажадає витрат на 3 млн. грн., а вихід на загальнонаціональний ринок зажадає вкладення 90 млн. грн. Якщо не проводити первинних пробних продажів на регіональному рівні, то рішення про вихід на загальнонаціональний ринок можна прийняти негайно. p align="justify"> Компанія розглядає результати продажів як успішні, середні або негативні залежно від обсягів продажів. Для регіонального рівня цим градаціям відповідають обсяги в 200, 100 і 30 тис. примірників, а для загальнонаціонального 6000, 3000 і 900 тис. примірників відповідно. Виходячи з даних за результатами регіональних тестувань аналогічних видів продукції компанія оцінює ймовірності зазначених трьох фіналів як 0,2, 0,5 і 0,3. Крім того, досліджуючи дані про співвідношення результатів регіональних продажів з подальшими продажами на загальнонаціональному ринку, компанія зуміла оцінити такі умовні ймовірності (табл.). br/>
Варіант № 2Условние ймовірності продажів на загальнонаціональному ринку успешныесредниеотрицательныеВероятности продажів на регіональному
Крім цього відомо, що кожна продаж приносить прибуток у 18 грн. як при продажу на регіональному ринку, так і на загальнонаціональному.
Завдання полягає у прийнятті обгрунтованої стратегії виходу (або невиходу) на ринок з новою товарною позицією.
Рішення
Побудуємо дерево рішень для даної задачі (рис.1)
Наведемо розрахунок характеристик дерева рішень:
, 2 * 0,6 + 0,5 * 0,7 + 0,3 * 0,1 = 0,5
, 2 * 0,2 + 0,5 * 0,2 + 0,3 * 0,2 = 0,2
, 2 * 0,2 + 0,5 * 0,1 + 0,3 * 0,7 = 0,3
000 * 18 = 108 000
000 * 18 = 54000