для побудови угруповання використовується тільки одна ознака, то таке угруповання називаються простий, якщо угруповання проводиться за кількома ознаками, її називають складною. Складна угруповання буває або комбінаційна, або багатовимірна.
Комбінаційна угруповання виконується послідовно: групи, виділені за однією ознакою, потім виділяються в підгрупи по іншому ознакою, які, у свою чергу, можуть виділятися за наступним іншому ознакою. У цьому випадку число груп буде дорівнює добутку числа виділених груп на число группіровочнихознак. Процедура визначення оптимального числа груп заснована на застосуванні формули Стерджесс:
В
де n - число груп; N - Число одиниць сукупності. p> З формули видно, що вибір числа груп залежить від обсягу сукупності. Якщо груп виявляється багато і вони включають мале число одиниць, то групові показники можуть стати ненадійними. Тому альтернативою комбінаційної угрупованню є багатовимірна угруповання, яка здійснюється за комплексом ознак одночасно. Її застосування вимагає використання електронної обчислювальної техніки. За допомогою спеціально розроблених електронних програм формуються однорідні групи на підставі близькості з усього комплексу ознак.
Визначення числа груп тісно пов'язано з поняттям величина інтервалу: чим більше число груп, тим менше величина інтервалу, і навпаки. Інтервал - Різниця між максимальним і мінімальним значеннями ознаки в кожній групі. Він визначає кількісні межі груп, що для статистичної практики має велике значення, особливо коли потрібно утворити якісно однорідні групи. Наприклад, досліджується сукупність підприємств з виконання колективних договорів. Тут не можна об'єднувати підприємства, що не виконали зобов'язання, і ті, які їх перевиконали. Показник тут - величина інтервалу.
Іншим прикладом є неможливість утворювати групу 95 - 105%, оскільки це різні частини сукупності. Слід утворити дві групи: 95 - 100% і 101 - 105%. У цьому випадку межі, за якими розрізняються сукупності, абсолютно дотримуються.
Кожен інтервал має нижню (Найменше значення ознаки) і верхню (найбільше значення ознаки) кордону або одну з них. Тому величина інтервалу є різниця між верхньою і нижньою межами інтервалу. Якщо у інтервалу вказана лише одна межа (у першого - верхня, у останнього - нижня), то мова йде про відкриті інтервалах. Якщо у інтервалу є і нижня, і верхня межі, то йдеться про закриті інтервалах. Закриті інтервали поділяються на рівні і нерівні (прогресивно зростаючі, прогресивно убуваючі), а також спеціалізовані і довільні.
Угруповання з рівними інтервалами будують тоді, коли досліджуються кількісні відмінності у величині ознаки всередині груп однакової якості, а також якщо розподіл носить більш-менш рівномірний характер. Якщо можна заздалегідь встановити певну кількість груп, то величину рівного інтервалу можна обчислити за формулою
В
де i - вели...