кою, що означає, що середнє арифметичне схильне сильному впливу «великих відхилень». Примітно, що для розподілів з великим коефіцієнтом асиметрії середнє арифметичне може не відповідати поняттю «середнього», а значення середнього з робастной статистики (наприклад, медіана) може краще описувати центральну тенденцію.
Класичним прикладом є підрахунок середнього доходу. Наприклад, звіт про «середній» чистому доході в Медині, штат Вашингтон, підраховане як середнє арифметичне всіх щорічних чистих доходів жителів, дасть напрочуд велике число через Білла Гейтса.
Якщо, наприклад, розглянути вибірку (1,2,2,2,3,9). Середнє арифметичне одно 3,17, але п'ять значень з шести нижче цього значення.
Іншими характеристиками центральної тенденції є мода і медіана.
Мода - це значення в безлічі спостережень, яке зустрічається найчастіше. Іноді в сукупності зустрічається більш, ніж одна мода (наприклад: 2,5,5,5,8,9,9,9,10; мода=5 і 9). У цьому випадку говорять, що сукупність мультимодальна. Із структурних середніх величин тільки мода володіє таким унікальною властивістю. Як правило мультимодальних вказує на те, що набір даних не підпорядковується нормальному розподілу.
Мода, як середня величина, вживається частіше для даних, що мають нечислову природу. При експертній оцінці з її допомогою визначають найбільш типи продукту, що враховується при прогнозі продажів або плануванні їх виробництва.
Медіана - 50-й процентиль, квінтель 0,5 можливе значення ознаки, яка ділить ранжувати сукупність (варіаційний ряд вибірки) на дві рівні частини: 50 «нижніх» одиниць ряду матимуть значення ознаки не більше, ніж медіана, а « верхні »50% - не менше, аніж медіана. Медіана є важливою характеристикою розподілу випадкової величини і так само як математичне очікування, може бути використано для центрування розподілу. Однак медіана більш робастний і тому може бути більш краща для розподілів з т.зв. важкими хвостами.
Медіана визначається для широкого класу розподілів (наприклад, для всіх безперервних), а у разі невизначеності, природним чином доопределяется, у той час, як математичне очікування може бути не визначено (наприклад, у розподілу Коші).
Якщо припустити, що в одній кімнаті виявилося 20 людина - 19 будинків і 1 мільярдер, які поклали на стіл гроші: бідняки по 5 доларів, а багач 1 млрд., то в сумі вийде 1000000095 доларів.
Середнє арифметичне в даному випадку буде 50000004,75 дол.
Медіана ж складе 5 дол. (полусумма десятого та одинадцятого значень ранжированого варіаційного ряду)
Таким чином, можна стверджувати, що кожен поклав на стіл не більше 5 доларів.
У даному випадку розрахунок середньої арифметичної невідповідна характеристика, оскільки воно значно перевищує суму готівки, наявних у середньої людини.
До недоліків даної характеристики є те, що при наявності парного кількості випадків і два середніх значення різняться, то медіаною може служити будь-яке число між ними (наприклад, у вибірці {1,2,3,4} медианой, за визначенням, може служити будь-яке число з інтервалу (2,3)). На практиці у разі чаші всього використовують середнє арифметичне двох середніх значень і застосовують формули:
якщо n - парне (2.1а)
якщо n - непарне (2.1б)
Скориставшись програмою STATISTICA, розраховуємо середнє арифметичне, моду і медіану статистичної таблиці «Чисельність економічно активного населення у 2012 році» (тис. чол.):
Таблиця 2.1
Найменування показателяСредняя аріфметіческаяМодаМедіанаЗначеніе показателя755,7558439,0568,000
Таким чином, середньоарифметична в окремо взятому суб'єкті Російської Федерації становить 755 тис. осіб, при цьому при розрахунку сукупності враховувалися як малозаселених районів у місцевостях крайньої Півночі і Далекого Сходу так і великі агломерації. Дана обставина перевищує значення, отримане в ході графічного аналізу варіаційного ряду.
У зв'язку з тим, що у вихідному статистичному спостереженні зустрічаються два суб'єкта Федерації з чисельністю 439 тис. чол., то модою і є дана величина (в іншому випадку вибірка була б полімодальної).
Медианой є величина 568 тис. чол.
Зазначені значення лежать у площині раніше розглянутого графічного зображення варіаційного ряду.
3. Оцінка варіації досліджуваного ознаки
Варіація - відмінність значень якої-небудь ознаки в різних одиниць сукупності за один і той же проміжок часу. Причиною виникнення варіації є різні умови існування різних одиниць сукупності. Варіація - необхідна умова існування і розвитку масових явищ. Визначення варіації необхідно при організації вибіркового спостереження, статистичному моделюванні та плануванні експертних опитувань. За ступенем варіації можна судити про однорідність сукуп...