змінних. Вони дозволяють описувати кожен кластер, якщо присвоїти йому номер або мітку. Якщо комп'ютерна програма кластеризації не видасть таку інформацію, її можна отримати через дискримінантний аналіз.
Часто має сенс профілювати кластери через змінні, які не з'явилися підставою для кластеризації. Ці змінні можуть включати демографічні, психографические характеристики, використання продукту або інші змінні. Наприклад, кластери можна вивести, виходячи з шуканих переваг. Подальше профілювання здійснюють через демографічні або психографические змінні, щоб визначити маркетингову стратегію для кожного кластера. Змінні, істотно розрізняються між кластерами, можна ідентифікувати дискримінантний аналізом і однофакторного дисперсійного аналізу.
3.6 Оцінка надійності і достовірності
Маючи кілька умовиводів, виведених з кластерного аналізу, не слід приймати жодного рішення по кластеризації, не виконавши оцінку надійності та достовірності цього рішення. Формальні процедури оцінки надійності та достовірності рішень кластеризації досить складні і не завжди виправдані тому ми їх опустимо. Однак наступні процедури забезпечать адекватну перевірку якості кластерного аналізу.
1. Виконуйте кластерний аналіз на підставі одних і тих же даних, але з використанням різних способів вимірювання відстані. Порівняйте результати, отримані на основі різних заходів відстані, щоб визначити, наскільки збігаються отримані результати.
2. Використовуйте різні методи кластерного аналізу і порівняйте отримані результати. p> 3. Розбийте дані на дві рівні частини випадковим чином. Виконайте кластерний аналіз окремо для кожної половини. Порівняйте кластерні центроїди двох підвибірок.
4. Випадковим чином видаліть деякі змінні. Виконайте кластерний аналіз за скороченим набору змінних. Порівняйте результати з отриманими на основі повного набору змінних.
5. У неієрархічному кластеризації рішення може залежати від порядку випадків у наборі даних. Виконайте аналіз кілька разів, міняючи порядок випадків, до отримання стабільного рішення.
В
Висновок
Кластерний аналіз є дуже зручним засобом для виділення сегментів ринку. У особливості в наше століття високих технологій, коли на допомогу людині приходять машини, і настільки трудомісткий процес ставати буквально секундним справою. p> Освіта сегментів залежить від наявних даних, а не визначається заздалегідь.
Змінні, які є підставою для кластеризації, слід вибирати, виходячи з досвіду попередніх досліджень, теоретичних передумов, що перевіряються гіпотез, а також на розсуд дослідника. Крім того, слід вибрати відповідну міру відстані (подібності). Особливість ієрархічної кластеризації - розробка ієрархічної або деревовидної структури. Ієрархічні методи кластеризації можуть бути агломеративного або дівізівнимі. Агломеративні методи включають: метод одиночній зв'язку, метод повного зв'язку і метод середньої зв'язку. Широко поширеним дисперсійним методом є метод Барда. Неієрархічні методи кластеризації часто називають методами k-середніх. Ці методи включають послідовний пороговий метод, паралельний пороговий метод і оптимизирующее розподіл. Ієрархічні і неієрархічні методи можна застосовувати спільно. Вибір методу кластеризації та вибір заходи відстані взаємопов'язані. p> Рішення про число кластерів приймають з теоретичних і практичних міркувань. У ієрархічної кластеризації важливим критерієм прийняття рішення про число кластерів є відстані, при яких відбувається об'єднання кластерів. Відносні розміри кластерів повинні бути такими, щоб мало сенс зберегти даний кластер, а не об'єднати його з іншими. Кластери інтерпретують з точки зору кластерних центроїдів. Часто інтерпретувати кластери допомагає їх профілювання через змінні, які не лежали в основі кластеризації. Надійність і достовірність рішень кластеризації оцінюють різними способами. br/>