/p>
В
Таким чином, відстань дорівнює відстані від об'єкта 1 до найближчого до нього об'єкта, що входить в кластер тобто . Toгдa матриця відстаней
В
Об'єднаємо другий і третій об'єкти, що мають найменшу відстань. Після об'єднання об'єктів маємо чотири кластери:
В
Знову знайдемо матрицю відстаней. Для тoгo щоб розрахувати pacстояніе до кластера скористаємося матрицею відстаней. Haпример, відстань між кластерами і дорівнює
В
В
Рисунок 2 - Дендрограмма
Провівши аналогічні розрахунки, отримаємо
В
Об'єднаємо кластери і відстань між якими, згідно матриці найменше. В результаті отримаємо три кластери і
Матриця відстаней буде мати вигляд:
В
Об'єднаємо тепер кластери і, відстань між якими. В результаті отримаємо два кластери: і відстань між якими, знайдене за принципом "найближчого сусіда". p> Результати ієрархічної класифікації об'єктів представлені на малюнку 2 у вигляді дендрогpамми.
На малюнку 2 наводяться відстані між поєднуваними на даному етапі кластерами (об'єктами). У нашому прикладі перевагу слід віддати передостаннього етапу класифікації, коли всі об'єкти об'єднані в два кластери і
1.2 Дискримінантний аналіз
.2.1 Методи класифікації з навчанням
Однорідність досліджуваних об'єктів визначається за допомогою як дискримінантного, так і кластерного аналізу. При цьому до дискримінанти аналізу звертаються тоді, коли методами кластерного аналізу завдання не вирішується, або для її вирішення відсутні необхідні вихідні дані. Методи дискримінантного аналізу припускають побудова функції і знаходження на основі цієї функції значення шуканих параметрів і і далі значення самої функції. p> Приступаючи до вивчення алгоритмів дискримінантного аналізу, потрібно пам'ятати про їх зв'язок з попередніми і насамперед з алгоритмами кластерного аналізу, як спорідненими.
У центрі уваги дискримінантного аналізу - виявлення, ідентифікація і порівняння однорідності груп по спільності спостережуваних об'єктів, яка визначається за емпіричними даними з їх однорідністю, установлюваної на основі повчальних (еталонних) оцінок чи вибірок.
Ось чому акцент у цій роботі має бути зроблений на ідентифікації областей достатності таких порівнянь, які визначаються за умовою збіжності результатів різних вибірок. Достатніми при цьому є області отриманні однорідних груп, спостережуваних об'єктів, наприклад високоприбуткових, середніх і збиткових компаній, образів позитивних і негативних героїв, здорових і хворих людей і т.д.
При дискримінантному аналізі, як ніде, істотне значення має визначення залежності від прийомів (лінійних, покрокових) від характеру статистичного визначення даних. Підготовка і відбір цих даних, процедури їх ідентифікації з навчальними вибірками, зокрема з експертними оцінками. p> Го...