сховище якнайшвидше. Тобто потенційно будь-яка модифікація оперативної БД може ініціювати додавання даних до сховища даних, а тоді буде потрібно оновити і всі репліки, для чого синхронізація все-таки потрібна.)
Підвищення вимог до безпеки даних
Зібрана разом узгоджена інформація про історію розвитку корпорації, її успіхи та невдачі, про взаємини з постачальниками і замовниками, про історію та стан ринку дає можливість аналізу минулої і поточної діяльності корпорації та побудови прогнозів для майбутнього. Ця інформація настільки цінна для корпорації, що не можна допустити можливості її витоку (насправді, якщо сховище даних однієї корпорації потрапить до рук аналітиків іншої корпорації, то всі аналітичні прогнози першого корпорації відразу стануть невірними). У системах, заснованих на сховищах даних, виявляється недостатньою захист даних в стилі мови SQL, яку забезпечують звичайні комерційні СУБД (цей рівень захисту відповідає класу C2 відповідно до класифікації Помаранчевої Книги міністерства оборони США). Для забезпечення належного рівня захисту доступ до даних повинен контролюватися не тільки на рівні таблиць і їх стовпців, а й на рівні окремих рядків (це вже відповідає класу B1 Помаранчевої Книги). Доводиться також вирішувати питання аутентифікації користувачів, захисту даних при їх переміщенні в сховища даних з оперативних баз даних і зовнішніх джерел, захисту даних при їх передачі по мережі.
Необхідність наявності багаторівневих довідників метаданих
Якщо роль метаданих (зазвичай містяться в таблицях-каталогах) в оперативних інформаційних системах досить обмежена, то для OLAP-систем наявність розвинених метаданих і засобів їх надання кінцевим користувачам є одним з основних умов успішної реалізації. Наприклад, перш, ніж менеджер корпорації задасть системі своє питання, він повинен зрозуміти, яка інформація є, наскільки вона акт?? Альна, чи можна їй довіряти, скільки часу може зайняти формування відповіді і т.д. Для користувача OLAP-системи потрібні метадані, принаймні, наступних типів:
(1) Описи структур даних, їх взаємозв'язків.
(2) Інформація про збережених на сховище даних і підтримуваних ним агрегатах даних.
(3) Інформація про джерела даних і про ступінь їх достовірності. Одна і та ж інформація могла потрапити в сховище даних з різних джерел. Користувач повинен мати можливість дізнатися, який джерело був обраний основним, і яким чином проводилися узгодження та очистка даних.
(4) Інформація про періодичності оновлень даних. Бажано знати не тільки те, якому моменту часу відповідають його цікавлять дані, але і коли вони наступного разу будуть оновлені.
(5) Інформація про власників даних. Користувачеві OLAP-системи може виявитися корисною інформація про наявність в системі даних, до яких він не має доступу, про власників цих даних і про дії, які він повинен зробити, щоб отримати доступ до даних.
(6) Статистичні оцінки часу виконання запитів. До виконання запиту корисно мати хоча б приблизну оцінку часу, який знадобиться для отримання відповіді, і обсягу цієї відповіді.
Потреба в ефективному зберіганні та обробці дуже великих обсягів інформації
Вже зараз відомі приклади сховищ даних, що містять терабайти інформації. За даними консалтингової компанії Meta Group, близько половини корпорацій, що використовують або планують використовувати сховища даних, припускає довести їх обсяг до сотень гігабайт. Проблемою таких великих сховищ є те, що накладні витрати на зовнішню пам'ять зростають нелінійно при зростанні обсягу сховища. Дослідження, проведені на основі тестового набору TPC-D, показали, що для баз даних об'ємом в 100 гігабайт буде потрібно зовнішня пам'ять об'ємом в 4.87 рази більша, ніж потрібно власне для корисних даних. При подальшому зростанні баз даних цей коефіцієнт збільшується.
.2 Реалізація сховищ і вітрин даних
Варіанти реалізації сховищ даних
· Віртуальне сховище даних
· Вітрини даних
· Глобальне сховище даних
· Багаторівнева архітектура сховища даних
Віртуальне сховище даних
У його основі - репозиторій метаданих, які описують джерела інформації (БД транзакційних систем, зовнішні файли та ін.), SQL-запити для їх зчитування та процедури обробки та надання інформації. Безпосередній доступ до останніх забезпечує ПО проміжного шару. У цьому випадку надмірність даних нульова. Кінцеві користувачі фактично працюють з транзакційними системами безпосередньо з усіма витікаючими звідси плюсами (доступ до «живих» дани...