Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Новые рефераты » Статистичний аналіз багатовимірних неоднорідних даних в програмному середовищі R

Реферат Статистичний аналіз багатовимірних неоднорідних даних в програмному середовищі R





к для одновимірного, так і для багатовимірного випадку.

Скошене N-мірне нормальний розподіл (skew-normal) має щільність


,


де - функція щільності N-мірного нормального розподілу з вектором середніх і ковариационной матрицею,

- функція розподілу стандартного нормального закону,

- вектор параметрів зміщення (асиметричності).

Визначимо інші розподілу з класу SMSN.

Визначення. Випадковий вектор має розподіл з класу SMSN, якщо


,


де - вектор параметрів центрального положення,

- випадковий вектор з розподілом,

U - неотрицательная випадкова величина, незалежна щодо Z, з функцією розподілу, - параметр (вектор параметрів).

Згідно з визначенням, маргінальна функція щільності випадкової величини Y має уявлення


,


де вибір функції визначає конкретний розподіл з класу SMSN.

Перерахуємо окремі випадки розподілу з класу SMSN, які реалізовані в бібліотеці mixsmsn і визначимо, за яких умов вони відносяться до класу:

) нормальний розподіл, якщо і;

) скошене нормальний розподіл, якщо;

) скошене t-розподіл, якщо - Гамма-розподіл;

) скошене слеш-розподіл, якщо - Бета-розподіл;

) скошене нормальний розподіл із засміченням (skew-contaminated normal), якщо U є дискретною випадковою величиною, приймаючої з імовірністю значення і з імовірністю і значення 1, де.

Модель суміші FMSMSN задається компонент суміші з номером l має розподіл з класу SMSN згідно з параметрами. При цьому будемо розглядати тільки такі суміші, в яких всі компоненти мають розподілу одного типу і параметри змішуючої функції розподілу рівні:.

Для моделей сумішей з розподілами з класу SMSN, які представлені вище, приймемо відповідні позначення (щодо розподілу ймовірностей для компонент суміші) нормальне - FMNOR, скошене нормальне - FMSN, скошене t-розподіл - FMST, скошене слеш-розподіл - FMSSL і скошене нормальний розподіл із засміченням - FMSCN.


Глава 3. Результати численних експериментів


У даній главі наводяться чисельні експерименти з використанням моделей типу FMSMSN з розподілами, описаними в розділі 2.2. У розділі 3.1 продемонструємо використання функцій з бібліотеки mixsmsn в R: спочатку змоделюємо вибірку асиметричних даних і застосуємо до їх аналізу EM алгоритм в припущеннях симетричності і асиметричності розподілів. Останнє необхідно для того, щоб окрім працездатності реалізованих процедур показати, наскільки порушення припущення про симетричність даних впливає на адекватність результатів. У розділі 3.2 застосуємо EM алгоритм для класифікації ненормованих квартальних даних по фінансовому стану підприємств промисловості в припущенні описаних моделей розподілів з класу SMSN для порівняння з методикою класифікації, що використовує звичайний кластерний аналіз в просторі нормованих коефіцієнтів.


. 1 Модельні дані


Згідно, змоделюємо вибірку з моделі FMSN з компонентами, що мають скошене багатовимірний нормальний розподіл розмірності. Виберемо наступні параметри:


;

,


Оцінимо параметри і класифікацію отриманої вибірки в умовах двох режимів застосування EM алгоритму: в припущенні моделі FMNOR або моделі FMSN. Для порівняння результатів буде використовувати статистики інформаційних критеріїв AIC, BIC, EDC і ICL. Отримані результати наведені в таблиці 1. Згідно з даними результатами, всі статистики приймають найменші значення для моделі FMSN, яка є твірною для вибірки даних, що і слід було довести.


Таблиця 1. - Інформаційні критерії для альтернативних моделей

МодельAICBICEDCICLFMNOR7773.8777827.8637821.4477838.332FMSN7644.4067718.0227709.2747723.102

Також, на малюнку 1 візуалізована використовувана вибірка даних з нанесенням контурних ліній, де зліва нанесені контурні лінії для випадку оцінювання моделі FMNOR, а праворуч - FMSN. Відповідно до даного малюнку, графічна візуалізація в даному випадку менш інформативна.


Малюнок 1. - Контурні графіки для моделей FMNOR, FMSN


Великий інтерес викликає порівняння оцінених класифікацій (у припущенні різних моделей) з істинною класифікацією, що позначає приналежність кожного спостереження до заданої компоненті суміші, для чого, як правило, використовуються оцінки помилок класифікації. Проте останнє виявилося неможливим, оскільки функція генерації вибірки даних, реалізована в бібліотеці mixsmsn, не надає вектор класифікації при генерації даних.


. 2 Реальні дані


Застосуємо EM алгоритм до квартальних даними по фінансовому стану підприємств (16 кв...


Назад | сторінка 3 з 5 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Розподіл даних
  • Реферат на тему: Розподіл системами управління базами даних
  • Реферат на тему: Розподіл випадкової величини
  • Реферат на тему: Фінансові результати та розподіл прибутку підприємства
  • Реферат на тему: Формування і розподіл фінансових результатів діяльності підприємства