на підтримка концепції віртуальних сховищ, даних - Virtual Warehouse. Віртуальне сховище даних забезпечує прозорий для аналітика доступ до відомостей, що зберігаються в будь-яких реляційних СУБД. Взаємодія з Virtual Warehouse відбувається аналогічно роботі з традиційним сховищем даних. Аналітик оперує бізнес-поняттями, заданими в семантичному шарі, і від нього приховані всі складності вибірки даних, як і у випадку з Deductor Warehouse. Користувач задає за допомогою простого Майстри, яка інформація його цікавить, а система автоматично трансформує їх у запити до бази даних. Таким чином, емулюється робота сховища даних, а дані реально не перевантажуються в спеціалізовану систему, всі операції проводяться «на льоту». Virtual Warehouse дозволяє представити інформацію, що зберігається в реляційних базах даних, в зручному для аналітика багатовимірному вигляді. Deductor Studio - це робоче місце аналітика. У цьому додатку здійснюється формалізація знань експерта. Програма включає всі необхідні для аналізу інструменти обробки: механізми імпорту даних з різнорідних джерел, методи очищення і предобработки, алгоритми побудови моделей і механізми експорту даних.
Всі дії з аналізу даних зводяться всього до 4 операціями:
. Імпорт даних.
У процесі імпорту дані виходять з джерела і завантажуються спеціальним чином в програму. Надалі з ними можна робити будь-які доступні операції, робота з усякою імпортованої таблицею відбувається однаково. Підтримується імпорт з найбільш поширених СУБД (Oracle, MS SQL, MySQL, Interbase ...), стандартних файлів обміну даними (dbf, txt, csv ...), офісних додатків (MS Excel, MS Access ...), бізнес-програм (1C v7, v8...). Крім того, в програму вбудований механізм імпорту із застосуванням стандартів доступу до даних ODBC і ADO.
. Обробка даних.
Обробкою називаетсо?? будь-яка дія над даними, що приводить до їх перетворення, наприклад, очищення даних або побудова моделей. Її результатом є набір даних, який можна знову обробити яким-небудь способом. Завдяки цьому забезпечується можливість побудови сценаріїв обробки, тобто послідовних операцій над даними, що призводять до потрібного результату. Підтримується широкий набір механізмів обробки: методи очищення (заповнення пропусків, редагування аномалій, фільтрація ...), інструменти предобработки (квантування, групування, сортування ...), методи побудови моделей (нейронні мережі, самоорганізуються карти, дерева рішень ...).
. Візуалізація.
Отримані результати можна переглянути різними способами, починаючи від простих таблиць і діаграм до багатовимірних кубів і спеціалізованих визуализаторов. Система побудована таким чином, що самостійно визначає можливі способи візуалізації та пропонує найбільш зручні способи відображення даних для кожного випадку.
. Експорт даних.
Результати обробки можуть бути вивантажені в безліч приймачів даних. Таким чином, оброблена і проаналізована інформація виходить за межі аналітичної платформи, потрапляє в бізнес-додатки, офісні програми та інше. У Studio реалізовані найсучасніші самообучающиеся алгоритми аналізу. Аналіз даних в Deductor Studio базується на побудові сценаріїв обробки.
Алгоритм типового сценарію представляється наступним чином:
. аналітик завантажує аналізовані дані в Excel або, в нашому випадку, в текстовий редактор;
. виробляє операцію імпорту;
. перевіряє дані на наявність помилок і виправляє їх, наприклад, продажу з нульовою сумою або повернення товару постачальнику, цей процес називається операцією очищення;
. групуються дані для отримання підсумкової інформації за місячними продажу певного товару - це операції трансформації;
. аналітик підбирає модель полінома або іншу формулу, які пояснювали, історичні продажу - це етап побудови моделі;
. застосовується побудована модель для отримання прогнозу на наступний період, реалізується процес прогнозування;
. останній етап аналізу - відправка результатів прогнозу зацікавленій особі. Цей процес реалізується експортом отриманих результатів. Працюючи з Deductor, аналітик будує сценарій за описаним алгоритмом. Studio не має механізмів введення і ручної правки даних. У випадку, якщо аналітик, отримавши дані, виявить у них, наприклад, помилки, він повинен буде описати правило роботи з такими даними. Наприклад, він повинен буде відфільтрувати дані про продажі з нульовою сумою. Це є обов'язковою операцією, так як вручну в Deductor Studio видалити непридатні записи неможливо. Те, що він сформулює, автоматично стане частиною сценарію. Така робота вимагає трохи більше зусиль і часу, ніж просте вид...