Введення
Наступив XXI століття стане етапним для проникнення нових інформаційних технологій і створюваних на їх основі високопродуктивних комп'ютерних систем в усі сфери людської діяльності - управління, виробництво, науку, освіту і т.д. Конструюються допомогою цих технологій інтелектуальні комп'ютерні системи покликані посилити розумові здібності людини, допомогти йому знаходити ефективні рішення так званих погано формалізованих і малоструктурованих завдань, що характеризуються наявністю різного типу невизначеностей і величезними пошуковими просторами. Складність таких завдань посилюється часто необхідністю їх вирішення в дуже обмежених часових рамках, наприклад, при управлінні складними технічними об'єктами в аномальних режимах або при оперативному вирішенні конфліктних (кризових) ситуацій. Найбільшої ефективності сучасні інтелектуальні системи досягають при реалізації їх як інтегруються, які об'єднують різні моделі і методи представлення та оперування знаннями, а також механізми придбання (витяги) знань з різних джерел.
Поняття «управління знаннями» народилося в середині 1990-х років у великих корпораціях, де проблеми обробки інформації придбали критичний характер. Поступово прийшло розуміння того, що знання - це фундаментальний ресурс, що базується на практичному досвіді фахівців і на даних, існуючих на конкретному підприємстві.
Тема вилучення знань привертає увагу вчених як в Європі, так і в усьому світі. Вивченням даної теми займаються У. Файяд, Г. Пятетскій-Шапіро, Т. Гаврилова, Л. Григор'єв, П. Сміт, Дж. Сейферт, В. Фролі, Ц. Матеус, Е. Монк, Б. Вагнер, С.Хааг і др.Mining перекладається як «видобуток» або «розкопка даних». Нерідко поруч з Data Mining зустрічаються слова «виявлення знань у базах даних» (knowledge discovery in databases) і «інтелектуальний аналіз даних». Їх можна вважати синонімами Data Mining. Виникнення всіх зазначених термінів пов'язане з новим витком у розвитку засобів і методів обробки даних.
До початку 90-х років не було особливої ??потреби переосмислювати ситуацію в цій галузі. Все йшло своєю чергою в рамках напрямку, званого прикладної статистикою. Теоретики проводили конференції та семінари, писали значні статті та монографії, насиченим аналітичними викладками. Разом з тим, практики завжди знали, що спроби застосувати теоретичні екзерсиси для вирішення реальних завдань в більшості випадків виявляються марними. Але на заклопотаність практиків до пори до часу можна було не звертати особливої ??уваги - вони вирішували головним чином свої приватні проблеми обробки невеликих локальних баз даних.
У зв'язку з удосконаленням технологій запису і зберігання даних на людей обрушилися колосальні потоки інформаційної руди в самих різних областях. Діяльність будь-якого підприємства (комерційного, виробничого, медичного, наукового і т.д.) тепер супроводжується реєстрацією та записом всіх подробиць його діяльності. Що робити з цією інформацією? Стало ясно, що без продуктивної переробки потоки сирих даних утворюють нікому не потрібну звалище.
Специфіка сучасних вимог до такої переробки наступні:
§ дані мають необмежений обсяг;
§ дані є різнорідними (кількісними, якісними, текстовими);
§ результати повинні бути конкретні і зрозумілі;