Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Доклады » Застосування кластерного аналізу для сегментації ринку

Реферат Застосування кластерного аналізу для сегментації ринку





ення всіх відстаней, виміряних між об'єктами двох кластерів, при цьому в кожну пару входять об'єкти з різних кластерів.

Широко відомим дисперсійним методом, використовуваним для цієї мети, є Метод Варда ( Ward ' s procedure ) Дисперсійний метод, в якому кластери формують таким чином, щоб мінімізувати квадрати евклідових відстаней до кластерних середніх. Для кожного кластера обчислюють середні всіх змінних. Потім для кожного об'єкта обчислюють квадрати евклідових відстаней до кластерних середніх. Ці квадрати відстаней підсумовують для всіх об'єктів. На кожній стадії об'єднують два кластери з найменшим приростом в повній внутрікластерной дисперсії. p> У центроїдного методах (centroid method) відстань між двома кластерами являє собою відстань між їх центроїди (середніми для всіх змінних). центроїдного метод (centroid method) Дисперсійний метод ієрархічної кластеризації, в якому відстань між двома кластерами являє собою відстань між їх центроїди (середніми для всіх змінних). Щоразу об'єкти групують і обчислюють новий центроид. З усіх ієрархічних методів методи середньої зв'язку та Варда показують найкращі результати в порівнянні з іншими методами.

До іншого типу процедур кластеризації відносяться неіерахіческіе методи кластеризації (nonhierarchical clustering), часто звані методом k-середніх. Ці методи включають послідовний пороговий метод, паралельний пороговий метод і оптимизирующее розподіл. У послідовному пороговому методі (Sequential threshold method) вибирають центр кластера і всі об'єкти, знаходяться в межах заданого від центру порогового значення, групують разом. Потім вибирають новий кластерний центр, і процес повторюють для несгруппірованних точок. Після того як об'єкт поміщений в кластер з цим новим центром, його вже не розглядають як об'єкт для подальшої кластеризації. p> Аналогічно працює паралельний пороговий метод (parallel threshold method), за винятком того, що одночасно вибирають кілька кластерних центрів і об'єкти в межах порогового рівня групують з найближчим центром.

Метод оптимизирующего розподілу (optimizing partitioning method) відрізняється від двох викладених вище порогових методів тим, що об'єкти можна згодом поставити у відповідність іншим кластерам (перерозподілити), щоб оптимізувати сумарний критерій, такий як середнє всередині кластерне відстань для даного числа кластерів. Два головні недоліки неієрархічних методів полягають у тому, що число кластерів визначається заздалегідь і вибір кластерних центрів відбувається незалежно. Більш того, результати кластеризації можуть залежати від обраних центрів. Багато неієрархічні процедури вибирають перші k випадків (k - число кластерів), не пропускаючи жодних значень в якості початкових кластерних центрів. Таким чином, результати кластеризації залежать від порядку спостережень у даних. Неієрархічна кластеризація швидше ієрархічних методів, і її вигідно використовувати при великому числі об'єктів або спостережень, Висловлено припущення про можливість використання ієрархічних і неієрархічних методів в тандемі. По-перше, початкове рішення по кластеризації отримують, використовуючи такі ієрархічні методи, як метод середньої зв'язку або метод Варда. Отримане цими методами число кластерів і кластерних центроїдів використовують в якості вихідних даних у методі оптимизирующего розподілу. Вибір методу кластеризації та вибір заходи відстані взаємопов'язані. Наприклад, квадрати евклідових відстаней використовують поряд з методом Варда і центроїдного методом. Деякі з неієрархічних методів також використовують квадрати евклідових відстаней.

В В  3.4 Ухвалення рішення про кількість кластерів

Головний питання кластерного аналізу - питання про кількість кластерів. Тут немає твердих правил, що дозволяють швидко прийняти рішення, але можна керуватися наступним.

1. При визначенні кількості кластерів керуються теоретичними та практичними міркуваннями. Наприклад, якщо мета кластеризації - виявлення сегментів ринку, то менеджмент може захотіти отримати конкретне число кластерів.

2. В ієрархічній кластеризації в якості критерію можна використовувати відстані, при яких об'єднують кластери/

3. У неієрархічному кластеризації креслять графік залежності відношення сумарної внутрішньогрупової дисперсії до міжгруповий дисперсії від числа кластерів. Точка, в якій спостерігається вигин або різкий поворот, вказує на прийнятне кількість кластерів. Збільшення числа кластерів за цю точку зазвичай безрезультативно.

4. Відносні розміри кластерів повинні бути досить виразними. h2> 3.5 Інтерпретація і профілювання кластерів

Інтерпретація і профілювання кластерів включає перевірку кластерних центроїдів. Центроїди представляють середні значення об'єктів, що містяться в кластері по кожній з ...


Назад | сторінка 3 з 4 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Кластерний аналіз і метод гірської кластеризації
  • Реферат на тему: Пошук кластерів спільнот Live Journal за допомогою методів Data Mining в се ...
  • Реферат на тему: Структура і властивості малоатомних кластерів
  • Реферат на тему: Вивчення кластерів та їх властивостей в області хімії
  • Реферат на тему: Теоретико-методологічні засади формирование кластерів у економіці України