потрібно мати для навчання мережі, часто виявляється непростим. Відомий ряд евристичних правил, що погоджує число необхідних спостережень з розмірами мережі (найпростіше з них свідчить, що число спостережень має бути в десять разів більше числа зв'язків у мережі). Насправді це число залежить також від (заздалегідь невідомої) складності того відображення, яке нейронна мережа прагне відтворити. Із зростанням кількості змінних кількість необхідних спостережень зростає нелінійно, так що вже при досить невеликому (наприклад, п'ятдесят) числі змінних може знадобитися величезне число спостережень. Ця трудність відома як прокляття розмірності raquo ;, і ми обговоримо її далі в цій главі.
Для більшості реальних завдань буває достатньо кількох сотень або тисяч спостережень. Для особливо складних завдань може знадобитися ще більша кількість, однак дуже рідко може зустрітися (навіть тривіальна) задача, де вистачило б менш сотні спостережень. Якщо даних менше, ніж тут сказано, то насправді у Вас недостатньо інформації для навчання мережі, і найкраще, що Ви можете зробити - це спробувати підігнати до даних деяку лінійну модель. У пакеті ST Neural Networks реалізовані засоби для підгонки лінійних моделей (див. Розділ про лінійні мережі, а також матеріал по модулю Множинна регресія системи STATISTICA).
У багатьох реальних задачах доводиться мати справу з не цілком достовірними даними. Значення деяких змінних можуть бути спотворені шумом або частково відсутніми. Пакет ST Neural Networks має спеціальні засоби роботи з пропущеними значеннями (вони можуть бути замінені на середнє значення цієї змінної або на інші її статистики), так що якщо у Вас не так багато даних, Ви можете включити в розгляд випадки з пропущеними значеннями (хоча, звичайно, краще цього уникати). Крім того, нейронні мережі в цілому стійкі до шумів. Однак у цієї стійкості є межа. Наприклад, викиди, тобто значення, що лежать дуже далеко від області нормальних значень деякої змінної, можуть спотворити результат навчання. У таких випадках найкраще постаратися виявити і видалити ці викиди (або видаливши відповідні спостереження, або перетворивши викиди в пропущені значення). Якщо викиди виявити важко, то можна скористатися наявними в пакеті ST Neural Networks можливостями зробити процес навчання стійким до викидів (за допомогою функції помилок типу міських кварталів raquo ;; см. Bishop, 1995), однак таке стійке до викидів навчання, як правило, менш ефективно, ніж стандартне.
Висновок
Ми завжди повинні обирати такі змінні, які, як передбачається, впливають на результат.
З числовими і номінальними змінними в пакеті ST Neural Networks можна працювати безпосередньо. Змінні інших типів слід перетворити на зазначені типи або оголосити незначущими.
Для аналізу потрібно мати порядку сотень або тисяч спостережень; чим більше в задачі змінних, тим більше потрібно мати спостережень. Пакет ST Neural Networks має засоби для розпізнавання значущих змінних, тому потрібно включати в розгляд змінні, в значимості яких ми не впевнені.
У разі необхідності можна працювати зі спостереженнями, що містять пропущені значення. Наявність викидів в даних може створити труднощі. Якщо можливо, необхідно видалити викиди. Якщо даних достаточну кількість - прибрати з розгляду спостереження з пропущеними значеннями.
нейронний мережу networks змінна
Список використаної літератури
1.Терехов С.А. Лекції з теорії і додатків штучних нейронних мереж. Лабораторія штучних нейронних мереж НТО - 2, ВНДІТФ, Снежинск.
.Деякі посилання сайтів з мережі Інтернет.