изації даних із застосуванням ефективних методів нейрообработкі інформації. Стандартні схеми аналізу та оцінки даних, не завжди приносять бажані результати, тому вони негнучкі і прив'язані до певного неадаптіруемому алгоритмом.
Існує різні моделі, які здатні класифікувати дані, проте їх основним недоліком є ??той факт, що, вони займають великі ресурси техніки і часу. Більш універсальним було б застосування альтернатив, що дозволяють моделі самонастроіться під нові недетермінірованние об'єкти.
Даною роботою ставитися завдання можливості кластеризації даних за допомогою нейронної мережі на основі клітинного автомата. Для виконання цієї мети була побудована програмна модель, апробована на прикладі розпізнавання 7-ми нормованих вибірок.
Розв'язність проблеми залежить від багатьох факторів. Перш за все, необхідно набрати достатню інформацію про досліджувані даних - Базу Даних (БД) представників кожного класу. Точність і ефективність класифікації безпосередньо залежить від добре підібраних і відкаліброваних еталонних представників. Внесення у еталонну БД погано детермінованих і сильно перекручених даних може спричинити за собою труднощі при класифікації, що істотно знизить відсоток розпізнавання.
Умовою для якісного роботи є достатній набір навчальних зразків, використовуючи які можна проводити аналітичні звірки і далі застосовувати алгоритми нейросетовой ідентифікації. Для самодостатності еталонів представники кожного символу БД повинні володіти наступними характеристиками: бути класифікуються, не бути сильно схожими між собою і не містити сильно деформовані елементи всередині класу.
У процесі асоціювання нових даних з об'єктами з БД, можуть виникати проблеми, пов'язані з неоднозначною класифікацією, коли важко або навіть неможливо людині або машині дати однозначну відповідь, до якого класу належить вектор. Очевидним прикладом важко класифікуються даних можуть бути вектори, що лежать на перетині класів, що не потрапили в замкнуті області, що лежать на кордоні рис. 3.1.
Якщо на перетині класів лежать навчальні зразки, то нейронна мережа може віднести їх і до одного і іншого класу. Частина зразків ми впевнено кластерізуем, а викличуть сумніви. Щоб виключити подібну неоднозначність, можна вдатися до розриву зв'язків в кінці навчання мережі. У процесі обробки ця програма виявляє характеристики даних подаються на вхід і групує найбільш близькі один до одного вектори.
Рис. 3.1 Спотворення класів.
. 1.1 Вибір топології мережі
Вибирати тип мережі слід виходячи з постановки задачі і наявних даних для навчання. Для навчання з учителем потрібна наявність для кожного елемента вибірки експертної оцінки. Іноді отримання такої оцінки для великого масиву даних просто неможливо. У цих випадках природним вибором є мережа, яка навчається без учителя, наприклад, самоорганізована карта Кохонена.
Мережі Кохонена принципово відрізняються від всіх інших типів мереж, в той час як всі інші мережі призначені для задач з керованим навчанням, мережі Кохонена головним чином розраховані на некероване навчання.
При керованому навчанні спостереження, складові навчальні дані, разом з вхідними змінними містять також і відповідні їм вихідні значення, і мережа повинна відновити відображення, що переводить першу в другі. У разі ж некерованого навчання навчальні дані містять тільки значення вхідних змінних.
На перший погляд це може здатися дивним. Як мережа зможе чомусь навчитися, не маючи вихідних значень? Відповідь полягає в тому, що мережа Кохонена вчиться розуміти саму структуру даних.
Одне з можливих застосувань таких мереж - розвідувальний аналіз даних. Мережа Кохонена може розпізнавати кластери в даних, а також встановлювати близькість класів. Таким чином, користувач може поліпшити своє розуміння структури даних, щоб потім уточнити нейромережевому модель. Якщо в даних розпізнані класи, то їх можна позначити, після чого мережа зможе вирішувати завдання класифікації. Мережі Кохонена можна використовувати і в тих завданнях класифікації, де класи вже задані, - тоді перевага буде в тому, що мережа зможе виявити подібність між різними класами.
Інша можлива область застосування - виявлення нових явищ. Мережа Кохонена розпізнає кластери в навчальних даних і відносить всі дані до тих чи інших кластерам. Якщо після цього мережа зустрінеться з набором даних, несхожим ні на один з відомих зразків, то вона не зможе класифікувати такий набір і тим самим виявить його новизну.
Мережа Кохонена має всього два прошарки: вхідний і вихідний, складений з радіальних елементів (вихідний шар називають також шаром топологічної карти). Елемент...