сту (рис.26) верхня лінія соответсвует ідеальної моделі, лінія під кутом 45 градусів - випадковий вибір. В даному випадку, приблизно 50% варіантів мають значення BikeBuyer=1, тобто клієнт, що купив велосипед. Чим ближче результат до іедальной моделі, тим точніше прогноз. Найкращий результат дає алгоритм дерев рішень.
Більш докладно ознайомитися з вмістом моделі дозволяє засіб перегляду Microsoft Generic Content Tree Viewer. В даному випадку, для моделі алгоритму Байеса, у разі отсутсвия у клмента машини - 1 889 клієнтів купили велосипед, приблизно 63%.
Побудуємо прогноз для окремого випадку - чи купить людина, що заповнив анкету, велосипед.
Виберемо одноелементний запит і задамо набір параметрів, що характеризують нового клієнта. Метою запиту буде - дізнатися значення атрибута BikeBuyer. Щоб дізнатися оцінку ймовірності для виконуваного прогнозу, використовуємо функцію PredicyProbability () із зазначенням стовпця [vTargetMail_DT]. [BikeBuyer] в качетсве аргументу.
Таким чином, пророкує значення і оцінка ймовірності покупки велосипеда клієнтом буде приблизно 0,7:
Рис.26. Результати аналізу точності передбачення
Отриманий запит можна представити на мові DMX:
[vTargetMail_DT]. [Bike Buyer], PredictProbability ([vTargetMail_DT]. [Bike Buyer])
[vTargetMail_DT] PREDICTION JOIN
(SELECT 39 AS [Age], 0-1 Miles AS [Commute Distance], Bachelors AS [English Education], F AS [Gender], 1 AS [Number Cars Owned], 2 AS [Number Children At Home], Europe AS [Region],
AS [Total Children], NULL AS [Yearly Income]) AS t
. 6 Завдання передбачення з продажу певного товару в заданому регіоні
Нехай нам необхідно дізнатися скільки клієнтів купило велосипед певної моделі Mountain - 100 в певному регіоні, тобто в Європі.
Для цього необхідно створити нове уявлення джерела даних, так як на основі попередніх цей аналіз виконати неможливо. Після дослідження наявних уявлень і таблиць на сервері, можна зробити наступний висновок: для реалізації поставленої задачі необхідно на базі джерела даних Adventure Works DW.ds створити уявлення джерела даних, яке включає в себе уявлення dbo.vDMPrep і таблиці DimProduct, DimProductCategory, DimProductSubcategory.
Отриману структуру назвемо v DM Prep_structure5.dmm. На базі цієї струтури будуть створені 3 моделі, що використовують алгоритми Байеса, дерев рішень і нейронних мереж.
Пророкує атрибут буде Amount (кількість).
Такому чином, виходить, що саме цю модель велосипеда в Європі купила група людей з низьким доходом, молодше 44 років. За всю історію компанії Adventure Works велосипед Mountain - 100 купило приблизно 221 чоловік.
Висновок
У пошуках можливостей вилучення даних і виділення з них інформації, що дозволяє робити прогнози і вживати заходів, компанії часто витрачають значні кошти на придбання великих і складних додатків бізнес-аналітики.
Метою випускної роботи бакалавра було дослідження математичних моделей, методів і засобів бізнес-аналітики СУБД SQL Server.
У ході вирішення поставленої мети були вирішені наступні завдання:
. Розглянуто теоретичні основи різних технологій в бізнес-аналітиці на прикладі СУБД SQL Server.
. Розглянуто основні принципи використовуваних математичних моделей.
. Проведено аналіз мовних засобів, за допомогою яких реалізовані методи й алгоритми для СУБД SQL Server.
. Розроблено практичне завдання класифікації клієнтів по доходу.
. Проведено аналіз точності передбачення з продажу певних товарів в заданих регіонах.
. Застосована задача кластеризації клієнтів та запропоновано рекомендації щодо застосування отриманих результатів.
архітектура server аналітика бізнес
Бібліографічний список
1.Барсегян А.А. Аналіз даних і процесів: навч. посібник/А.А. Барсегян, М.С. Купріянов, І.І. Холод, М.Д. Тесс, С.І. Єлізаров. ? 3-е изд., Перераб. і доп. ? СПб .: БХВ-Петербург, 2009.? 512 с.
.Полубояров В.В. Використання MS SQL Server Analysis Services 2008 для побудови сховищ даних. [Електронний ресурс] Режим доступу: http://facultyresourcecenter/curriculum/RU/8621-MS-SQL-Server-An.aspx?c1=ru-ruamp;c2=RU
.Паклін Н.Б., Орєшков В.І. Бізнес-аналітика: від даних до знань: навчальний посібник. 2-е изд., Испр.- СПб .: Питер, 2013. - 704 с .: ил. ...