ьник; інформацією на даного позичальника з кредитного бюро, в якому зберігається кредитна історія дорослого населення країни; даними руху по рахунках, якщо мова йде про клієнта банку.
Кредитні аналітики оперують такими поняттями: В«характеристики-ознакиВ» клієнтів і В«градації-значенняВ», які приймає ознака. В анкеті клієнта характеристиками-ознаками є питання анкети (вік, сімейний стан, професія), а градаціями-значеннями-відповіді на ці запитання. У спрощеному вигляді скорингова модель дає зважену суму певних характеристик. У результаті отримують інтегральний показник (score); чим він вищий, тим вище надійність клієнта (табл. 3.). Інтегральний показник кожного клієнта порівнюється з якимсь заданим рівнем показника. Якщо показник вище цього рівня, то видається кредит, якщо нижче цієї лінії, - ні.
Складність у тому, які характеристики-ознаки слід включати в модель і які вагові коефіцієнти повинні їм відповідати. Філософія скорингу полягає не в пошуку пояснень, чому ця людина не платить. Скоринг використовує характеристики, які найбільш тісно пов'язані з ненадійністю клієнта. Невідомо, чи поверне даний позичальник кредит, але відомо, що в минулому люди цього віку, цієї професії, з таким рівнем освіти і числом утриманців кредит не повертали (або повертали).
Таблиця 3. Скорингова карта
Показник
Значення
Бали
Вік
20 - 25
100
26 - 30
107
31 - 40
123
............
..............
Дохід
1000 - 3000
130
3001 - 5000
145
5001 - 6000
160
............
..............
Серед переваг скорингових систем західні банкіри вказують в першу чергу зниження рівня неповернення кредиту. Далі відзначаються швидкість і неупередженість у прийнятті рішень, можливість ефективного управління кредитним портфелем, визначення оптимального співвідношення між прибутковістю кредитних операцій та рівнем ризику.
2.2. Кластерний аналіз
Методи кластерного аналізу дозволяють розбити досліджувану сукупність об'єктів на групи однорідних в деякому сенсі об'єктів, званих кластерами або класами. Ієрархічні і паралельні кластер-процедури практично реалізовані лише в задачах класифікації не більше кількох десятків спостережень. До вирішення завдань з великим числом спостережень (як у наших цілях) застосовують послідовні кластер-процедури - це ітераційні алгоритми, на кожному кроці яких використовується одне спостереження (або невелика частина вихідних спостережень) і результати розбиття на попередньому кроці. Ідею цих процедур реалізована в В«SPSSВ» методі середніх (В«K-Means ClusteringВ») з наперед заданим числом класів. p> Алгоритм полягає в наступному: вибирається задане число k-точок і на першому кроці ці точки розглядаються як "центри" кластерів. Кожному кластеру відповідає один центр. Об'єкти розподіляються по кластерах за таким принципом: кожен об'єкт відноситься до кластеру з найближчим до цього об'єкта центром. Таким чином, всі об'єкти розподілилися по k кластерам. Потім заново обчислюються центри цих кластерів, якими після цього моменту вважаються покоординатного середні кластерів. Після цього знову перерозподіляються об'єкти. Обчислення центрів і перерозподіл об'єктів відбувається до тих пір, поки не стабілізуються центри.
Якщо дані розуміти як крапки в просторі ознак, то завдання кластерного аналізу формулюється як виділення "згущувань точок", розбиття сукупності на однорідні підмножини об'єктів.
При проведенні кластерного аналізу звичайно визначають відстань на безлічі об'єктів; алгоритми кластерного аналізу формулюють у термінах цих відстаней. Мер близькості і відстаней між об'єктами існує безліч. Їх вибирають залежно від мети дослідження. Зокрема, евклідова відстань краще використовувати для кількісних змінних, відстань хі-квадрат - для дослідження частотних таблиць, є безліч заходів для бінарних змінних. p> Заходи близькості відрізняються від відстаней тим, що вони тим більше, чим більш схожі об'єкти. <В
<...