мою распространенной.мерой близькості є евклідова відстань між об'єктами, представленими точками в n-вимірному просторі. Чим менше ця відстань, тим більше близькість. p> Завдання багатовимірної угруповання зводиться до виділення згущувань точок (об'єктів) у n-вимірному просторі. Групи (кластери) формуються на підставі близькості об'єктів одночасно по всьому комплексу ознак, що описують об'єкт. Знаходження цих груп здійснюється методами кластерного аналізу, на ЕОМ. p> Багатовимірні угруповання дозволяють вирішувати цілий ряд таких важливих завдань економіко-статистичного дослідження, як формування однорідних сукупностей, вибір істотних ознак, виділення типових груп об'єктів і ін
При складанні структурних угруповань на основі варіюють кількісних ознак необхідно визначити, кількість груп та інтервали угруповання. Інтервал - кількісне значення, що відділяє одну одиницю (групу) від інший, тобто інтервал окреслює кількісні межі груп. p> Як правило, величина інтервалу являє собою різницю між максимальним і мінімальним значеннями ознаки в кожній групі. Питання про число груп і величиною інтервалу слід вирішувати з урахуванням безлічі обставин, насамперед виходячи з цілей дослідження, значення досліджуваної ознаки і т.д. Кількість груп і величина інтервалу пов'язані між собою: чим більше утворено груп, тим менше інтервал і навпаки. Кількість груп залежить від кількості одиниць досліджуваного об'єкта і ступеня колеблемости группировочного ознаки. При невеликому обсязі сукупності не можна утворювати велике число груп, так як групи будуть нечисленними.
При визначенні кількості груп необхідно прагнути до того, щоб були враховані особливості досліджуваного явища. Тому число груп має бути оптимальним, в кожну групу має входити досить велике число одиниць сукупності, що відповідає вимозі закону великих чисел. p> Таким чином; при вирішенні питання про чисельності одиниць в групах потрібно керуватися не формальними ознаками, а знанням сутності досліджуваного явища. На кількість виділених груп істотний вплив доводить ступінь варіації группировочного ознаки: чим вона більше, тим більше слід утворити груп.
Орієнтовно визначити оптимальне кількість груп з рівними інтервалами можна за формулою американського вченого Стерджесс:
n = 1 + 3,322 lg N (4)
де N - чисельність одиниць сукупності. p> Формула Стерджесса придатна за умови, що розподіл одиниць сукупності за цією ознакою наближається до нормальному і при цьому застосовуються рівні інтервали в групах. Щоб отримати групи, адекватні дійсності, необхідно керуватися сутністю досліджуваного явища.
Інтервали можуть бути рівні і нерівні. При дослідженні економічних явищ можуть застосовуватися нерівні (прогресивно зростаючі, прогресивно убуваючі) інтервали. p> Угруповання з рівними інтервалами доцільні в тих випадках, коли варіація проявляється у порівняно вузьких кордонах і розподіл є практично рівномірним (наприклад, при ...