ізація моделі
Формат оператора виглядає наступним чином:
SELECT [FLATTENED] [TOP lt; n gt;] lt; expression list gt; FROM lt; model gt; .CASES
[WHERE lt; condition expression gt;] [ORDER BY lt; expression gt; [DESC | ASC]]
Якщо деталізація для моделі інтелектуального аналізу даних не включена, виконання даної інструкції завершиться помилкою. Для розширень інтелектуального аналізу даних активувати деталізацію можна тільки при створенні моделі (за допомогою інструкції WITHDRILLTHROUGH). У середовищі BI DevStudio можна додати деталізацію і в існуючу модель, але перш ніж буде можна переглядати варіанти, необхідно виконати повторну обробку моделі.
Якщо деталізація включена як для моделі, так і для структури інтелектуального аналізу даних, користувачі, які є членами ролі з дозволом на деталізацію моделі і структури, можуть звертатися до стовпців в структурі інтелектуального аналізу даних, які не включені в модель.
2.5.6 Запит значень стовпця
Нижче наведено синтаксис оператора, що дозволяє отримати значення зазначених стовпців моделі.
SELECT [FLATTENED] DISTINCT [TOP lt; n gt;] lt; expression list gt; FROM lt; model gt;
[WHERE lt; condition list gt;] [ORDER BY lt; expression gt;]
При цьому для дискретного стовпця будуть введені всі можливі значення, для безперервного - середнє значення, для дискретизованного - середнє значення для кожного з визначених у процесі дискретизації інтервалів.
. 5.7 Побудова прогнозів
Завдання прогнозування в мові DMX також вирішується за допомогою оператора SELECT. При цьому найчастіше використовується конструкція прогнозирующего сполуки - PREDICTION JOIN. З її допомогою шаблонами моделі зіставляється набір даних із зовнішнього джерела, що дозволяє визначити значення для прогнозованого стовпця.
Для обробки модель отримує вхідні дані із зовнішнього джерела, визначає найбільш відповідний шаблон і видає результат.
Запит з використанням функції OPENQUERY
У тому випадку, коли потрібно зробити прогноз для безлічі варіантів, які беруться з таблиці бази даних, можна використовувати функцію OPENQUERY. При цьому попередньо потрібно створити уявлення джерела даних.
Використання функції Predict
Функція Predict повертає прогнозоване значення або набір значень для заданого стовпця. Синтаксис буде наступним:
Predict ( lt; scalar column reference gt ;, [option1], [option2], [option n], [INCLUDE_NODE_ID], n) ( lt; table column reference gt ;, [option1], [option2 ], [option n], [INCLUDE_NODE_ID], n)
У той же час просто вибір прогнозованого стовпця в заголовку SELECT аналогічний викликом функції PREDICT з параметрами за замовчуванням.
. 5.8 Створення копії моделі - оператор SELECT INTO
Розглянемо створення копії існуючої моделі інтелектуального аналізу даних. Для цього використовується синтаксис:
SELECT INTO lt; new model gt; lt; algorithm gt; [( lt; parameter list gt;)] [WITH DRILLTHROUGH [,] [FILTER ( lt; expression gt;)]]
FROM lt; existingmodel gt;
Таблиця 11. Значення наведених атрибутів
АтрібутОпісаніеnewmodelімя для нової створюваної моделі; algorithmназваніе використовуваного новою моделлю алгоритму інтелектуального аналізу даних; parameterlistcпісок через кому параметрів алгоритму; expressionвираженіе, визначальне фільтр для значень, що потрапляють в нову модель; existingmodelімя існуючої моделі для копіювання.
Якщо існуюча модель є навченої, нова модель автоматично обробляється при виконанні цієї інструкції. В іншому випадку нова модель оставляется необробленої.
2.6 Аналіз результатів глави 2
У даній главі описуються мовні засоби, за допомогою яких будуть реалізовані методи й алгоритми, зазначені в першому розділі. Для оперативного аналізу даних (OLAP) використовується мова MDX, а для інтелектуального аналізу даних (Data Mining) - DMX. Обидві мови SQL-подібні, але відмінності від стандартної мови для реляційних таблиць присутні.
У другій частині розглядаються основні базові поняття і вирази для мов, а також оператори і різні функції, щоб простіше розуміти спосіб реалізації практичної частини.
У наступному розділі (практичної частини) буде розглянута безпосередньо сама реалізація поставлених завдань у дод...