я в дісперсіях, якові звітність, нівелюватіНомінальні шкали (Міри подібності) Коефіцієнт Хеммінга Для порівняння об »єктів у змішаних шкалах найменувань и порядкуКоефіцієнт Роджерса-Танімото Если ВАЖЛИВО Тільки наявність Властивості, а не ее відсутністьДовільні шкаліМера блізькості Журавльова Фактично здійснюється Перехід від кількісніх шкал до якісніхМера блізькості Вороніна Підвіщує змістовну обгрунтованість розрахунків
Примітки:
1 - значення l-ї ознакой у i-го обєкта, l =; i, j =;
- вектор-стовпець значень всех ознакой на i-му обєкті;
W - 1 - матриця, оберніть до коваріаційної;
- загальна кількість значень властівостей, что співпадають, (нульові та одінічніх, де 1 - наявність властівостей, 0 - відсутність);
- кількість співпадаючіх одінічніх властівостей;
- кількість одінічніх значень властівостей;
; де - значення порога для l-го ознаки;
=- міра блізькості обєктів по l-му ознакою;
- інформаційна вага ознаки, розрахована питань комерційної торгівлі чином.
Етап 2 Використання того або Іншого методу кластерного АНАЛІЗУ в залежності від цілей Дослідження. Одним Із найбільш Поширення способів проведення ітераційніх процедур вісь вже прежде сорок років Виступає метод k-середніх (Розроблення у 1967 р. Дж. МакКуіном). Застосування его потребує Здійснення таких кроків:
розділення вихідних Даних досліджуваної сукупності на Завдання кількість кластерів;
обчислення багатовімірніх середніх (центрів тяжіння) віділеніх кластерів;
розрахунок Евклідової відстані кожної одініці сукупності до визначених центрів тяжіння кластерів та побудова матріці відстаней, яка грунтується на метріці відстаней. Використовують Різні метрики відстаней, Наприклад: Евклідова відстань (проста и зважено), Манхеттенська, Чебишева, Мінковського, Махалонобіса ТОЩО;
визначення новіх центів тяжіння та новіх кластерів
Вибір даного методу кластерізації обгрунтований Наступний ПЕРЕВАГА:
Данії метод не будує геометричні кластери, что дозволяє унікнуті їхнього перетінання І, як наслідок, влучення одного й того самого елемента в кілька кластерів;
дозволяє формуваті завданні кількість кластерів, что полегшує економічну інтерпретацію отриманий результатів.
Використання методу k-середніх грунтується на двох крітеріях:
Мінімізація відстані всередіні кластера между его елементами.
Максімізація відстані между центрами кластерів. Використання даного крітерію дозволяє віділіті кластери, что знаходяться на максимально можлівій відстані друг від друга
2.3 Характеристика методів багатомірної класіфікації з навчання
Існують Такі основні методи багатомірної класіфікації з навчання як діскрімінантній аналіз. Діскрімінантній аналіз є Розділом багатовімірного статистичного АНАЛІЗУ, Який дозволяє вівчаті Відмінності между двома и більш групами про «єктів по декількох змінніх одночасно. Діскрімінантній аналіз - це загальний Термін, что відносіться до декількох тісно зв »язаних статистичних процедур. ЦІ процедури можна розділіті на методи інтерпретації міжгруповіх відмінностей - діскрімінації и методи класіфікації СПОСТЕРЕЖЕ...