INIZAIMI
, 262
(Constant)
-3,288
В
Точність розпізнавання дискримінантний аналізом вище, ніж кластерним. Але результати раніше, залишаються незадовільними.
2.4. Дерево класифікацій
Дерево класифікацій є більш загальним алгоритмом сегментації навчальної вибірки прецедентів. У методі дерева класифікацій сегментація прецедентів задається не за допомогою n-мірної сітки, а шляхом послідовного дроблення факторного простору на вкладені прямокутні області (рис .1).
В
Рис.1. Дерево класифікації
На першому кроці поділ вибірки прецедентів на сегменти проводиться по самому значимого чинника. На другому і наступних кроках щодо кожного з отриманих раніше сегментів процедура повторюється до тих пір, поки ніякої варіант подальшого дроблення не приводить до істотного розбіжності між співвідношенням позитивних і негативних прецедентів у нових сегментах. Кількість розгалужень (сегментів) вибирається автоматично. p> У розглянутим методикою також не дається відповідь, наскільки кредит хороший чи поганий. Метод не дозволяють отримати точну кількісну оцінку ризику і встановити допустимий ризик.
2.5. Нейронні мережі
Нейронні мережі NN використовуються при визначенні кредитоспроможності юридичних осіб, де аналізуються вибірки меншого розміру, ніж у споживчому кредиті. Найбільш успішною областю їх застосування стало виявлення шахрайства з кредитними картка-ми. Нейронні мережі виявляють нелінійні зв'язки між змінними, які можуть призвести до помилки в лінійних моделях. NN дозволяють обробляти прецеденти навчальної вибірки з більш складним (чим прямокутники) видом сегментів (рис. 2). Форма сегментів залежить від внутрішньої структури NN Формули і коефіцієнти моделі ризику на основі NN позбавлені фізичного і логічного сенсу.
В
Рис.2. Сегменти поділу В«хорошихВ» і В«поганихВ» об'єктів в NN
Нейромережа - це В«чорний ящикВ», внутрішній зміст якого (так звані ваги нейронів) не має сенсу в термінах оцінки ризику. Такі методики не дозволяють пояснити, чому даному позичальнику слід відмовити у кредиті. NN-моделі класифікації мають низьку стабільністю (робастного).
2.6. Технології Data mining
В основі технології data mining лежать алгоритми пошуку закономірностей між різними факторами у великих обсягах даних. При цьому аналізуються залежності між усіма факторами; але, оскільки навіть при невеликому числі факторів кількість їх всіляких комбінацій зростає експоненціально, в data mining застосовуються алгоритми апріорного відсікання слабких залежностей [1]. Говорячи термінами аналізу кредитоспроможності, data mining на основі даних про видані кредити виявляє ті фактори, які суттєво впливають на кредитоспроможність позичальника, і обчислює силу цього впливу. Відповідно, чим сильніше певний фактор впливає на кредитоспроможність, тим більший бал йому присвоюється в методиці скорингу. Чим більше дані держателя кредитної карти схожі на дані В«Кредитоспроможного громадянинаВ», тим більший ліміт по кредиту він може отримати, тим кращі умови йому можуть бути надані
Головна перевага методик на основі data mining полягає в тому, що вони можуть працюватиме на малих вибірках. При великих ви-Бірках їх точність, робастність і прозорість недостатні У них також не дається відповідь, наскільки кредит добрий чи поганий Метод не дозволяє отримати кількісну оцінку ризику, встановити допустимий ризик, призначити ціну за ризик і виявити вклади факторів і їх градацій в ризик
2.7. Лінійна імовірнісна регресійна модель
В
Задача регресійного аналізу полягає в побудові моделі, що дозволяє за значеннями незалежних показників отримувати оцінки значень залежної змінної. Лінійна модель пов'язує значення залежної змінної Y із значеннями незалежних показників X k (Факторів) формулою:
Y = B 0 + B 1 X 1 + ... + B p X p + e
де e - випадкова помилка. Тут X k означає не "ікс в ступені k", а змінна X з індексом k. Традиційні назви "залежна" для Y і "незалежні" для X k відображають не стільки статистичний сенс залежності, скільки їх змістовну інтерпретацію. Величина e називається помилкою регресії. Перші математичні результати, пов'язані з регресійним аналізом, зроблені у припущенні, що регресійна помилка розподілена нормально з параметрами N (0, Пѓ 2 ), помилка для різних об'єктів вважаються незалежними. Крім того, в даній моделі ми розглядаємо змінні X як невипадкові значення, Таке, на практиці, виходить, коли йде активний експеримент, в якому задають значення X (наприклад, призначили зарплату працівнику), а потім вимірюють Y (оцінили, який стала продуктивність праці). За це іноді залежну...