к для одновимірного, так і для багатовимірного випадку.
Скошене N-мірне нормальний розподіл (skew-normal) має щільність
,
де - функція щільності N-мірного нормального розподілу з вектором середніх і ковариационной матрицею,
- функція розподілу стандартного нормального закону,
- вектор параметрів зміщення (асиметричності).
Визначимо інші розподілу з класу SMSN.
Визначення. Випадковий вектор має розподіл з класу SMSN, якщо
,
де - вектор параметрів центрального положення,
- випадковий вектор з розподілом,
U - неотрицательная випадкова величина, незалежна щодо Z, з функцією розподілу, - параметр (вектор параметрів).
Згідно з визначенням, маргінальна функція щільності випадкової величини Y має уявлення
,
де вибір функції визначає конкретний розподіл з класу SMSN.
Перерахуємо окремі випадки розподілу з класу SMSN, які реалізовані в бібліотеці mixsmsn і визначимо, за яких умов вони відносяться до класу:
) нормальний розподіл, якщо і;
) скошене нормальний розподіл, якщо;
) скошене t-розподіл, якщо - Гамма-розподіл;
) скошене слеш-розподіл, якщо - Бета-розподіл;
) скошене нормальний розподіл із засміченням (skew-contaminated normal), якщо U є дискретною випадковою величиною, приймаючої з імовірністю значення і з імовірністю і значення 1, де.
Модель суміші FMSMSN задається компонент суміші з номером l має розподіл з класу SMSN згідно з параметрами. При цьому будемо розглядати тільки такі суміші, в яких всі компоненти мають розподілу одного типу і параметри змішуючої функції розподілу рівні:.
Для моделей сумішей з розподілами з класу SMSN, які представлені вище, приймемо відповідні позначення (щодо розподілу ймовірностей для компонент суміші) нормальне - FMNOR, скошене нормальне - FMSN, скошене t-розподіл - FMST, скошене слеш-розподіл - FMSSL і скошене нормальний розподіл із засміченням - FMSCN.
Глава 3. Результати численних експериментів
У даній главі наводяться чисельні експерименти з використанням моделей типу FMSMSN з розподілами, описаними в розділі 2.2. У розділі 3.1 продемонструємо використання функцій з бібліотеки mixsmsn в R: спочатку змоделюємо вибірку асиметричних даних і застосуємо до їх аналізу EM алгоритм в припущеннях симетричності і асиметричності розподілів. Останнє необхідно для того, щоб окрім працездатності реалізованих процедур показати, наскільки порушення припущення про симетричність даних впливає на адекватність результатів. У розділі 3.2 застосуємо EM алгоритм для класифікації ненормованих квартальних даних по фінансовому стану підприємств промисловості в припущенні описаних моделей розподілів з класу SMSN для порівняння з методикою класифікації, що використовує звичайний кластерний аналіз в просторі нормованих коефіцієнтів.
. 1 Модельні дані
Згідно, змоделюємо вибірку з моделі FMSN з компонентами, що мають скошене багатовимірний нормальний розподіл розмірності. Виберемо наступні параметри:
;
,
Оцінимо параметри і класифікацію отриманої вибірки в умовах двох режимів застосування EM алгоритму: в припущенні моделі FMNOR або моделі FMSN. Для порівняння результатів буде використовувати статистики інформаційних критеріїв AIC, BIC, EDC і ICL. Отримані результати наведені в таблиці 1. Згідно з даними результатами, всі статистики приймають найменші значення для моделі FMSN, яка є твірною для вибірки даних, що і слід було довести.
Таблиця 1. - Інформаційні критерії для альтернативних моделей
МодельAICBICEDCICLFMNOR7773.8777827.8637821.4477838.332FMSN7644.4067718.0227709.2747723.102
Також, на малюнку 1 візуалізована використовувана вибірка даних з нанесенням контурних ліній, де зліва нанесені контурні лінії для випадку оцінювання моделі FMNOR, а праворуч - FMSN. Відповідно до даного малюнку, графічна візуалізація в даному випадку менш інформативна.
Малюнок 1. - Контурні графіки для моделей FMNOR, FMSN
Великий інтерес викликає порівняння оцінених класифікацій (у припущенні різних моделей) з істинною класифікацією, що позначає приналежність кожного спостереження до заданої компоненті суміші, для чого, як правило, використовуються оцінки помилок класифікації. Проте останнє виявилося неможливим, оскільки функція генерації вибірки даних, реалізована в бібліотеці mixsmsn, не надає вектор класифікації при генерації даних.
. 2 Реальні дані
Застосуємо EM алгоритм до квартальних даними по фінансовому стану підприємств (16 кв...