Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Новые рефераты » Статистичний аналіз багатовимірних неоднорідних даних в програмному середовищі R

Реферат Статистичний аналіз багатовимірних неоднорідних даних в програмному середовищі R





арталів, 300 підприємств, 4800 спостережень). Оцінимо всі наявні в бібліотеки моделі: FMNOR, FMSN, FMSSL, FMSCN, і FMT і FMST. Для оцінювання будемо використовувати ненормовані коефіцієнти. Також будемо класифікувати вибірку на 4 класу, тобто розглянемо випадок 4 компонент в суміші розподілів.

При обчисленні деяких коефіцієнтів для 4 спостережень були отримані пропущені значення. Виключивши дані спостереження з аналізу, отримаємо вибірку з +4796 спостережень. Застосуємо EM алгоритм для оцінювання кожної з перерахованих моделей. У ході експериментів при оцінюванні моделей FMSSL, FMSCN не була досягнута збіжність EM алгоритму, тому були отримані результати тільки для інших чотирьох моделей, які представлені в таблиці 2.


Таблиця 2. - Інформаційні критерії для альтернативних моделей

МодельAICBICEDCICLFMNOR158380.4161482.2164056.9161956.3FMSN155541.7159006.1161881.8159468.5FMT141542.8144644.6147219.2145131.8FMST140066.1143530.5146406.2144054.5

Згідно таблиці 2, найкраще відповідність даними досягнуто при використанні моделі FMST (суміш скошених багатовимірних t-розподілів), оскільки значеннями статистик всіх інформаційних критеріїв для даної моделі приймають найменше значення.

Також були зроблені спроби оцінити всі вищевказані моделі за відповідними нормованим даними, проте у всіх випадках в обчисленнях виникли помилки, що не дозволило оцінити ні одну з моделей. Останнє може свідчити про незастосовність моделей і алгоритмів з бібліотеки mixsmsn до нормованих даними. Це викликає труднощі при порівнянні класифікації, отриманої за допомогою кластерно?? про аналізу в просторі нормованих коефіцієнтів, за класифікаціями, отриманими за допомогою зазначених алгоритмів по ненормованим даними, тому тут дане порівняння не наводиться. В цілому, оцінювання такої вибірки даних для даних алгоритмів виявилося досить важким завданням (потурбувалися досить багато часу для обчислень), тому в подальших дослідженнях пропонується розбити всю вибірку даних по кварталах і оцінювати одержувані підвибірки окремо.


Висновок


У даній роботі отримані наступні результати:

) підготовлений огляд по методам і алгоритмам параметричної класифікації багатовимірних неоднорідних спостережень за допомогою алгоритмів типу EM, призначених для аналізу переважно асиметричних даних;

) підготовлений огляд основних програмних бібліотек для середовища статистичного програмування R, які можуть бути корисні для вирішення зазначені методи і алгоритми;

) проведені експерименти на модельних і реальних даних, що ілюструють особливості застосування процедур, що реалізують зазначені алгоритми;

) виявлено недоліки зазначеного програмного забезпечення, як відсутність вектора істинної класифікації при моделюванні даних, а також їх непридатність до нормованим даними при аналізі даних по фінансовому стану підприємств.

Наведені огляд літератури свідчить про широку затребуваності даної теми, як в наукових дослідженнях, так і на практиці. Достаток програмних реалізацій відповідних методів і алгоритмів, зокрема в R, дає великі можливості по аналізу даних без необхідності самостійно писати дані алгоритми. Однак, зважаючи специфічності конкретного завдання, потрібна доробка окремих алгоритмів, що відносно швидко може бути досягнуто при використанні мови статистичного програмування R.


Бібліографічний список


1.Айвазян, С.А. Прикладна статистика. Класифікація і зниження розмірності/С.А. Айвазян [и др.].- М .: Фінанси і статистика, 1989. - 607с.

2.Mengersen, K. Mixtures: Estimation and Applications/K. Mengersen, CP Robert, D.M. Titterington.- Hoboken, N.J .: Wiley, 2011. - 311 p.

.Fraley, C. Model-based Clustering, Discriminant Analysis and Density Estimation/C. Fraley, AE Raftery//J. of the American Statistical Association.- 2002. -Vol. 97, № 458. - P. 611-631.

4.Basso, R.M. Robust Mixture Modeling Based on Scale Mixtures of Skew-normal Distributions/RM Basso, V.H. Lachos, C.R.B. Cabral, P. Ghosh//Computational Statistics amp; Data Analysis.- 2010. - Vol. 54. - P. 2926-2941.

5.Dempster, A.P. Maximum likelihood from incomplete data via the EM algorithm/AP Dempster, N.M. Laird, D.B. Rubin//Journal of the Royal Statistics Society. Ser. B. - 1977. - Vol. 39, № 1. - P. 1-38.

6.Малюгін, В.І. Система статистичних кредитних рейтингів підприємств: методика побудови, верифікації та застосування/В.І. Малюгін [и др.]//Банківський Вісник. Дослідження банку.- №5.- 2013. - 73 с.

7.Bilmes, J.A. A Gentle Tutorial of the EM Algorithm and its Application to Parameter Estimation for Gaussian Mixture and Hidden Markov Models: Techni...


Назад | сторінка 4 з 5 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Розробка алгоритмів і програмних засобів для побудови компетентнісно-орієнт ...
  • Реферат на тему: Використання в'язкопружного моделі матеріалу зі спектром часів релаксац ...
  • Реферат на тему: Аналіз алгоритмів шифрування в мережах передачі даних
  • Реферат на тему: Аналіз алгоритмів шифрування в мережах передачі даних
  • Реферат на тему: Спостереження за передачею даних в мережі організації за допомогою засобів ...