их дій, простіше кажучи, клієнтів, для яких ще немає даних по транзакціях. Процес внесення такого запису буде реалізований як створення нового рядка з нульовими значеннями у всіх числових полях, крім, звичайно, зовнішніх ключів. Це дозволить підрахувати, при необхідності, точне число всіх абонентів по регіону або тарифного плану, а не тільки тих, які з моменту укладення контракту встигли скористатися будь послугою. Даний аспект також необхідно врахову ть при розробці процесу завантаження даних у сховище з зовнішніх джерел.
Визначившись з таблицями і зв'язками між ними, можна візуалізувати загальну структуру сховища даних; його схема представлена ​​на Рис 3.5.
В
Рис 3.5 Схема сховища даних
дані завантаження сховище користувач
Глава 4: Практична реалізація
.1 Створення структури сховища
На основі схеми представленої на рис.3.5, засобами Oracle Database створюємо таблиці сховища і прописуємо зв'язку між ними. Дані дії виконуються в редакторі SQL запитів Oracle SQL Plus. (Див. Додаток 1)
4.2 Розробка ETL-процесу
При роботі аналітичної системи, заснованої на сховище даних, необхідно, щоб сховище було заповнено актуальною для аналізу інформацією і постійно поповнювалося. Звідси випливає необхідність переміщення даних із систем оперативної реєстрації даних в сховищі. Основними етапами цього переміщення є: витяг, перетворення та завантаження (ETL - Extract Transform Load). Для досягнення успіху при перенесенні даних з однієї системи в іншу вкрай важливо чітко уявляти процеси ETL, а також структуру вихідного програми та програми призначення. p align="justify"> Загалом, додатки ETL витягують інформацію з початкової бази даних реєструючої системи, перетворюють її у формат, підтримуваний сховищем даних, а потім завантажують у нього перетворену інформацію. Для того щоб ініціювати процес ETL, застосовуються програми або модулі вилучення даних для читання записів у вихідній базі даних і для підготовки інформації, що зберігається в цих записах, до процесу перетворення
У загальному випадку об'єкти, що у процесі ETL можна представити у вигляді сукупності трьох областей, представлених на Рис 4.1:
В
Рис 4.1 Узагальнена схема ETL процесу
. джерело даних, як сукупність таблиць оперативної системи і додаткових довідників;
. проміжна область, яка представляє собою сукупність таблиць, що використовуються виключно в якості проміжного сховища при завантаженні сховища даних;
. приймач даних - саме сховище даних.
Рух даних від джерела до приймача називають потоком даних.
Процес перевантаження даних - це реалізація потоку даних від єдиного набору даних джерела до наборів даних ...