Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Статьи » Дослідження математичних моделей, методів і засобів бізнес-аналітики СУБД SQL Server

Реферат Дослідження математичних моделей, методів і засобів бізнес-аналітики СУБД SQL Server





в інтелектуального аналізу даних. Але в даній роботі ми обмежимося розглядом тих алгоритмів, які реалізуються в SQL Server 2008, так як тема бакалаврської роботи пов'язана з розглядом бізнес-аналітики на цій платформі.


Таблиця 3. Відповідність алгоритмів Microsoft для задач інтелектуального аналізу даних

Завдання інтелектуального аналізу даннихАлгорітми інтелектуального аналізу даннихКлассіфікаціяДля задачі класифікації використовуються наступні алгоритми Microsoft: спрощений алгоритм Байеса, алгоритм дерева прийняття рішень, алгоритм нейронної сеті.РегрессіяДля завдання регресії використовуються наступні алгоритми Microsoft: алгоритм дерева прийняття рішень, алгоритм лінійної регресії, алгоритм часових рядів, алгоритм нейронної мережі, алгоритм логічної регрессіі.КластерізаціяДля завдання кластеризації використовуються наступні алгоритми Microsoft: алгоритм кластеризації, алгоритм кластеризації последовательностей.Поіск взаімосвязейДля завдання пошуку взаємозв'язків використовуються наступні алгоритми Microsoft: алгоритм дерева прийняття рішень, алгоритм взаємозв'язків. 1.4.3.1 Спрощений алгоритм Байеса

Спрощений алгоритм Байеса - це алгоритм класифікації, заснований на обчисленні умовної ймовірності значень прогнозованих атрибутів. Передбачається, що вхідні атрибути є незалежними і визначений хоча б один вихідний атрибут.

Алгоритм заснований на використанні формули Байеса. Нехай - повна група несумісних подій, а B - деяка подія, вірогідність якого позитивна. Тоді умовна ймовірність події, якщо в результаті експерименту спостерігалося подія B, може бути обчислена за формулою:


. (24)


Формула Байеса дозволяє обчислити умовні (апостеріорні) ймовірності.

Для СУБД MS SQL Server +2008 опис моделі інтелектуального аналізу зберігається у вигляді ієрархії вузлів. Для спрощеного алгоритму Байеса ієрархія має 4 рівня. Середа розробки BI Dev Studio дозволяє переглянути вміст моделі.

Для коректного використання цього алгоритму необхідно враховувати:

1. вхідні атрибути повинні бути взаємно незалежними;

. атрибути можуть бути тільки дискретними або дискретизованного (у процесі дискретизації безліч значень безперервного числового атрибута розбивається на інтервали і далі йде роботи з номером інтервалу);

. алгоритм вимагає меншої кількості обчислень, ніж інші алгоритми інтелектуального аналізу для MS SQL Server 2008, тому він частина використовується для початкового дослідження даних. З цієї ж причини алгоритм кращий для аналізу великих наборів даних з великою кількістю вхідних атрибутів.


. 4.3.2 Алгоритм дерева прийняття рішень

Алгоритм являє собою алгоритм регресії і алгоритм класифікації, що надається службами Microsoft SQL Server Служби Analysis Services для використання в прогнозуючому моделюванні як дискретних, так і безперервних атрибутів.

Для дискретних атрибутів алгоритм здійснює прогнозування на основі зв'язку між вхідними стовпцями в наборі даних. Він використовує значення цих стовпців (відомі як стану) для прогнозування станів стовпця, який позначається як прогнозований. Алгоритм ідентифікує вхідні стовпці, які корельовані з прогнозованим стовпцем.

Для безперервних атрибутів алгоритм використовує лінійну регресію для визначення місця розбиття дерева рішень.

Якщо декілька стовпців встановлені як прогнозовані або якщо вхідні дані містять вкладену таблицю, яка задана як прогнозована, то алгоритм будує окреме дерево рішень для кожного прогнозованого стовпця.

Принцип роботи алгоритму

Алгоритм дерева прийняття рішень будує модель інтелектуального аналізу даних шляхом створення ряду разбиений в дереві. Ці розбиття представлені як вузли. Алгоритм додає вузол до моделі кожен раз, коли з'ясовується, що вхідний стовпець має значну кореляцію з прогнозованим стовпцем. Спосіб, яким алгоритм визначає розбиття, відрізняється в залежності від того, чи прогнозує він безперервний стовпець або дискретний стовпець.

Прогнозування дискретних стовпців

Спосіб, яким алгоритм дерева прийняття рішень будує дерево для дискретного прогнозованого стовпця, можна продемонструвати з використанням гістограми. Показана гістограма, на якій побудований прогнозований стовпець «Покупці велосипедів» у порівнянні з вхідним стовпцем «Вік». Гістограма «Б» показує, що вік людини допомагає визначити, чи купить ця людина велосипед.


Рис. 16. Гістограма «А»


Кореляція, показана на діаграмі, призведе до того, що алгоритм дерева прийняття рішень створить новий вузол в моделі.

Додаванн...


Назад | сторінка 10 з 27 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Алгоритм прийняття стратегічних рішень, орієнтованих на зростання цінності ...
  • Реферат на тему: Розробка програми, що реалізує алгоритм бінарного дерева
  • Реферат на тему: Історія формування поняття &алгоритм&. Найвідоміші алгоритми в історії мат ...
  • Реферат на тему: Алгоритм розробки Бази даних поиска псіхологічніх тестів в мережі Internet ...
  • Реферат на тему: Блочно-часової алгоритм фільтрації геолокаційні даних