Введення
Інтелектуальний аналіз даних, або Data Mining, - це процес виявлення в сирих даних раніше невідомих, нетривіальних, практично корисних і доступних інтерпретації знань, необхідних для прийняття рішень у різних сферах людської діяльності. p> Сучасні технології Data ​​i> Mining ( Discovery-driven data mining ) обробляють інформацію з метою автоматичного пошуку шаблонів (патернів), характерних для будь-яких фрагментів неоднорідних багатовимірних даних. На відміну від оперативної аналітичної обробки даних ( online analytical processing, OLAP ) у Data Mining тягар формулювання гіпотез і виявлення незвичайних шаблонів перекладено з людини на комп'ютер. p> Виділяють п'ять стандартних типів закономірностей (завдань), які дозволяють виявляти методи Data Mining : асоціація, послідовність, класифікація, кластеризація, прогнозування. p> Закономірність типу а ссоціація спостерігається в даних, коли кілька подій зв'язані один з одним і відбуваються при цьому одночасно. Наприклад, дослідження, проведене в супермаркеті, може показати, що 65% купили кукурудзяні чіпси беруть також і В«кока-колуВ», а при наявності знижки за такий комплект В«колуВ» набувають в 85% випадків. Маючи в своєму розпорядженні відомостями про подібну асоціацію, менеджерам легко оцінити, наскільки дієва надається знижка.
Закономірність типу В« послідовністьВ» передбачає наявність в даних ланцюжки пов'язаних один з одним і розподілених у часі подій. Так, наприклад, після покупки будинку в 45% випадків протягом місяця купується і нова кухонна плита, а в межах двох тижнів 60% новоселів обзаводяться холодильником.
Закономірність типу В« класифікаціяВ» виявляється в даних на основі аналізу ознак вже класифікованих об'єктів, при цьому відома приналежність об'єктів до класів. Результатом є формування правил віднесення об'єктів до класів.
Закономірність типу В« кластеризаціяВ» передбачає наявність в даних сходитися з яких-небудь ознаками груп об'єктів, причому кількість груп і приналежність об'єктів до них заздалегідь не задані. З допомогою кластеризації кошти Data Mining самостійно виділяють різні однорідні групи даних.
Пошук закономірності типу В« прогнозуванняВ» проводиться на основі інформації, що зберігається в базах даних у вигляді тимчасових рядів. Якщо вдається побудувати математичну модель і знайти шаблони, адекватно відображають цю динаміку, є ймовірність, що з їх допомогою можна передбачити і поведінку системи в майбутньому.
В В
Розділ 1Опісаніе об'єкта дослідження, як системи
Системний підхід реалізується в методології системного аналізу, який є одним з ефективних інструментів дослідження соціально-економічних і політичних процесів. <В
1.1 Мета об'єкта дослідження
Об'єктом дослідження є показники діяльності кредитних організацій. Метою об'єкта дослідження є відображення динаміки процесу взаємодії населення і кредитних організацій.
В
1.2 Структура системи, опис зовнішнього середовища
Тип описуваної структури - плоска (горизонтальна декомпозиція) (схема1)
Схема 1
В
Іпотечний
Споживчий
<В
В В
В В
1.3 Класифікація системи
Дана система є відкритої , тому що основні елементи системи - кредитор і позичальник - забезпечують постійне циркулювання грошових коштів з дачею грошей в борг (входом) грошових коштів з боку кредитора і виплат (виходу) отриманої суми плюс відсотки з боку позичальник.
Описувана система - гетерогенна . Доказом даного факту є різноманіття видів кредиту, які зображені на схемі 1. p> Система є керованої . У ролі управлінців цієї системи виступають кредитор і позичальник. А так як вони є в теж час і елементами даної системи, то дану систему можна вважати самокерованої. h1> Розділ 2 Інтелектуальний аналіз даних про закономірності
функціонування об'єкта дослідження
Мета аналізу полягає в застосуванні інтелектуального аналізу даних для дослідження заданої структури даних для розробки прийняття рішень.
У даній роботі основною завданням є виявлення відмінностей між регіонами Росії на основі показників діяльності кредитних організацій наве...