аними OLTP - систем виявляється досить незначним;
· в DW зберігається якась підсумкова інформація, яка в базах даних OLTP-систем взагалі відсутня;
· під час завантаження в DW записи сортуються, очищаються від непотрібної інформації і призводять до єдиного формату. Після такої обробки це вже зовсім інші дані.
.3 Компоненти інформаційного сховища
ПО проміжного шару
Забезпечує мережевий доступ і доступ до баз даних. Сюди відносяться мережеві та комунікаційні протоколи, драйвери, системи обміну повідомленнями та ін.
Транзакційні БД і зовнішні джерела інформації
Бази даних OLTP-систем історично призначалися для ефективної обробки структур даних у відносно невеликому числі чітко визначених транзакцій. Через обмежену цільової спрямованості «облікових» систем застосовувані в них структури даних погано підходять для систем підтримки прийняття рішень. Крім того, вік багатьох встановлених OLTP-систем досягає 10 - 15 років.
Рівень доступу до даних
Що відноситься сюди ПО забезпечує спілкування кінцевих користувачів з інформаційним сховищем і завантаження необхідних даних з транзакційних систем. В даний час універсальною мовою спілкування служить мова структурованих запитів (SQL).
Завантаження та попередня обробка
Цей рівень включає в себе набір засобів для завантаження даних з OLTP-систем і зовнішніх джерел. Виконується, як правило, у поєднанні з додатковою обробкою: перевіркою даних на чистоту, консолідацією, форматуванням, фільтрацією і ін.
Інформаційне сховище
Являє собою ядро ??всієї системи - один або декілька серверів БД.
Метадані
Метадані (репозиторій, «дані про дані»). Грають роль довідника, що містить відомості про джерела первинних даних, алгоритмах обробки, яким вихідні дані були піддані, і т.д.
Рівень інформаційного доступу
Забезпечує безпосереднє спілкування користувача з даними DW допомогою стандартних систем маніпулювання, аналізу та надання даних типу MS Excel, MS Access, Lotus 1-2-3 і ін.
Рівень управління (адміністрування)
Відстежує виконання процедур, необхідних для поновлення інформаційного сховища або підтримки його стану. Тут програмуються процедури підкачки даних, перебудови індексів, виконання підсумкових (підсумовуючих) розрахунків, реплікації даних, побудови звітів, формування повідомлень користувачам, контролю цілісності та ін.
2. Проблеми, їх рішення і реалізація інформаційних сховищ
.1 Проблеми інтеграції даних
Зупинимося на деяких проблемах реалізації сховища даних:
· Неоднорідність програмного середовища
· Розподілений характер організації
· Підвищені вимоги до безпеки даних
· Необхідність наявності багаторівневих довідників метаданих
· Потреба в ефективному зберіганні та обробці дуже великих обсягів інформації
Неоднорідність програмного середовища
Сховище даних практично ніколи не створюється на порожньому місці. Майже завжди кінцеве рішення буде різнорідним, тобто в ньому будуть використовуватися автономно розроблені програмні засоби. Насамперед це стосується формування інтегрованого узгодженого набору даних, які можуть надходити з різнорідних баз даних, електронних архівів, публічних і комерційних електронних каталогів, довідників, статистичних збірників. При побудові сховища даних доводиться вирішувати завдання побудови єдиної, узгоджено функціонуючої інформаційної системи на основі неоднорідних програмних засобів і рішень. При виборі засобів реалізації сховища даних доводиться враховувати безліч факторів, які включають рівень сумісності різних програмних компонентів, легкість їх освоєння та використання, ефективність функціонування і т.д.
Розподілений характер організації
У концепції сховища даних зумовлено те, що операційна аналітична обробка може виконуватися в будь-якому вузлі мережі незалежно від місця розташування основного сховища. Хоча при аналітичній обробці дані тільки читаються, і потреба в синхронізації відсутня, для досягнення ефективності необхідно підтримувати реплікацію даних у різних вузлах мережі. (Насправді, все не так просто. Однією з вимог до сховищ даних є те, щоб свіжа інформація надходила в ...