Введення
Ключовим фактором ринкового успіху в сьогоднішніх умовах високої конкуренції стає оперативне прийняття ефективних ділових рішень. Однак природне прагнення багатьох організацій удосконалити свої процеси прийняття рішень може наштовхнутися на труднопреодолимое перешкода - величезний обсяг і висока складність даних, що містяться в різноманітних оперативних і виробничих системах цих організацій. Зробити таку інформацію доступною більш широкому колу бізнес-користувачів - ось одна з найбільш серйозних проблем, що стоять сьогодні перед професіоналами в області інформаційних технологій.
Багато організації для вирішення цього завдання обирають шлях побудови сховища (data warehouse), що дозволяє «вивільнити» інформацію з жорстких рамок оперативних систем і краще усвідомити проблеми реального бізнесу. Незважаючи на те, що сховища даних бувають різних типів і можуть спиратися на різні методології, і навіть філософії, побудови, всі вони мають деякі спільні ознаки:
Інформація в сховище даних організовується навколо базових понять, що використовуються в діяльності підприємства (це, наприклад, клієнти, продукти, продажу або постачальники), тобто застосовується методологія проектування, керованого даними.
«Сирі» дані збираються з неінтегрованих оперативних і успадкованих додатків, очищаються від помилок, потім агрегуються і надаються у вигляді, понятому бізнес-користувачам.
На підставі відгуків користувачів, а також закономірностей, виявлених за допомогою сховища даних, архітектура останнього з часом зазнає змін - тобто процес створення сховища є ітеративним.
Побудова сховищ даних - процес складний за самою своєю природою і тому зазвичай дорогий і тривалий.
Оскільки процес створення сховищ даних є ітеративним за своєю природою, він вимагає регулярного перепроектування протягом всього життєвого циклу програми.
Об'єктом курсової роботи виступає сховище даних.
Метою курсової роботи є теоретичне вивчення поняття «сховища даних», а також аналіз побудови сховища даних.
Виходячи з цілей курсової роботи, її завданнями є:
позначити сутність сховища даних;
проаналізувати процес створення сховища даних;
розглянути архітектури сховищ даних;
дати визначення метаданих сховища даних
В якості джерел літератури були використані підручники та навчальні посібники з інформатики, обчислювальної техніки, інформаційних технологій системам. Для більш глибокого опрацювання теми використовувалися матеріали мережі Інтернет.
1. Сутність і побудова сховища даних
Сховище даних (data warehouse) по суті, являє собою центр, в який збирається вся необхідна інформація з різних підрозділів підприємства. Перш ніж потрапити в сховище, дані повинні бути відповідним чином оброблені. Бази даних, в яких відбувається накопичення, обробка первинних даних, на підставі яких будується сховище, будемо далі називати транзакційними (Додаток А). Різні відділи можуть використовувати неоднакові системи обробки зі своїми транзакційними БД. Відповідно, перш ніж використовувати ці розрізнені дані, їх потрібно проаналізувати. Цей процес займає досить тривалий період у процесі підготовки до створення сховища.
Оскільки сховище - це об'єднання та інтеграція даних, необхідно виявити різницю у форматах зберігання інформації в різних джерелах, провести ревізію коректного заповнення полів таблиць, побудувати план взаємозв'язку інформації, а також вирішити, яка інформація з транзакційних баз буде необхідна для подальшого використання в сховище.
Сховище даних повинне вирішувати певні завдання:
отримання повної інформації про клієнта,
надання конкретних даних для подальшого аналізу певного сегмента ринку і т.д.
Сховище має бути гнучким. Практика показує, що в міру розвитку бізнесу завдання змінюються. Відповідно, змінюються вимоги до даних, звітності і, як наслідок, до сховища.
Підставою для початку проектування сховища служить все зростаюча потреба бізнесу компанії в певних категоріях даних за різний період часу. Обсяг інформації, на підставі якої необхідно приймати рішення, постійно зростає і стає головним болем аналітиків і менеджерів компанії. Це може призвести до великих витрат часу на оцінку реального стану справ, складання планів робіт, а також отримання недостовірних даних - адже розібратися у великій кількості звітів, таблиць, операцій і т.д. стає вельми непросто (Додаток Б). При цьому дані з різних підрозділ...