Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Статьи » Методи дослідження ринку кредитування

Реферат Методи дослідження ринку кредитування





дстань між двома кластерами являє собою відстань між їхніми найближчими точками.

Метод повної зв'язку аналогічний методу одиночній зв'язку, за винятком того, що в його основі лежить максимальна відстань між об'єктами, або правило далекого сусіда. У методі повного зв'язку відстань між двома кластерами обчислюють як відстань між двома їх самими віддаленими точками.

Метод середнього зв'язку діє аналогічно. Однак у цьому методі відстань між двома кластерами визначається як середнє значення всіх відстаней, виміряних між об'єктами двох кластерів, при цьому в кожну пару входять об'єкти з різних кластерів.

Широко відомим дисперсійним методом є Метод Варда. Дисперсійний метод, в якому кластери формують таким чином, щоб мінімізувати квадрати евклідових відстаней до кластерних середніх. Для кожного кластера обчислюють середні всіх змінних. Потім для кожного об'єкта обчислюють квадрати евклідових відстаней до кластерних середніх. Ці квадрати відстаней підсумовують для всіх об'єктів. На кожній стадії об'єднують два кластери з найменшим приростом повною внутрікластерной дисперсії.

У центроїдного методах відстань між двома кластерами являє собою відстань між їх центроїдами (середніми для всіх змінних). Щоразу об'єкти групують і обчислюють новий центроид. З усіх ієрархічних методів методи середнього зв'язку і Варда показують найкращі результати в порівнянні з іншими методами.

Ієрархічні методи кластерного аналізу використовуються при невеликих обсягах наборів даних. Ієрархічні алгоритми пов'язані з побудовою дендрограмм (від грецького dendron - дерево ), які є результатом ієрархічного кластерного аналізу. Дендрограмма описує близькість окремих точок і кластерів один до одного, представляє в графічному вигляді послідовність об'єднання (поділу) кластерів.

Дендрограмма (dendrogram) - деревоподібна діаграма, що містить n рівнів, кожен з яких відповідає одному з кроків процесу послідовного укрупнення кластерів.

Існує багато способів побудови дендограмм. У дендограмм об'єкти можуть розташовуватися вертикально або горизонтально. Приклад вертикальної дендрограмми наведено на рис 3.


Рис. 3 Приклад дендрограмми


Числа 11, 10, 3 і т.д. відповідають номерам об'єктів або спостережень вихідної вибірки. Ми бачимо, що на першому кроці кожне спостереження представляє один кластер (вертикальна лінія), на другому кроці спостерігаємо об'єднання таких спостережень: 11 і 10; 3, 4 і 5; 8 і 9; 2 і 6. На другому кроці продовжується об'єднання в кластери: спостереження 11, 10, 3, 4, 5 і 7, 8, 9. Даний процес продовжується до тих пір, поки всі спостереження не об'єднаються в один кластер.

До іншого типу процедур кластеризації відносяться неієрархічні методи кластеризації. До даного типу відносять, наприклад, метод k-середніх. Цей метод включає послідовний пороговий метод, паралельний пороговий метод і оптимизирующее розподіл. У послідовному пороговому методі вибирають центр кластера і всі об'єкти, що знаходяться в межах заданого від центру порогового значення, групують разом. Потім вибирають новий кластерний центр, і процес повторюють для НЕ згрупованих точок. Після того як об'єкт поміщений у кластер з цим новим центром, його вже не розглядають як об'єкт для подальшої кластеризації.

До цього ж типу кластеризації відносять самоорганізуються карти Кохонена. Мережі, звані картами Кохонена, - це один з різновидів нейронних мереж, однак вони принципово відрізняються від розглянутих вище методів, оскільки використовують неконтрольованого навчання. При такому навчанні навчальна множина складається лише із значень вхідних змінних, у процесі навчання немає порівнювання виходів нейронів з еталонними значеннями. Можна сказати, що така мережа вчиться розуміти структуру даних. Самоорганізуючі карти можуть використовуватися для вирішення таких завдань, як моделювання, прогнозування, пошук закономірностей у великих масивах даних, виявлення наборів незалежних ознак і стиснення інформації.

В результаті навчання карта Кохонена класифікує вхідні приклади на кластери (групи схожих прикладів) і візуально відображає багатовимірні вхідні дані на площині нейронів. Унікальність методу самоорганізованих карт полягає в перетворенні n-мірного простору в двомірне.

Неієрархічні методи виявляють більш високу стійкість по відношенню до шумів і викидів, некоректного вибору метрики, включенню незначущих змінних в набір, який бере участь в кластеризації. Ціною, яку доводиться платити за ці достоїнства методу, є слово апріорі raquo ;. Аналітик повинен заздалегідь визначити кількість кластерів, кількість ітерацій або правило зупинки, а також деякі інші параметри кластеризації. Це складно починаючим фа...


Назад | сторінка 8 з 16 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Кластерний аналіз і метод гірської кластеризації
  • Реферат на тему: Мінімізація функції багатьох змінних. Наближені чисельні методи. Метод Мо ...
  • Реферат на тему: Метод навчання нейронних мереж (правило зворотного поширення помилки)
  • Реферат на тему: Метод нейтралізації в титриметричному методі аналізу
  • Реферат на тему: Методи кластерізації: процедура Мак-кіна, метод К-методів, сітчасті методи