для відшукання глобального мінімуму помилки доводиться експериментувати з великим числом мереж різної конфігурації, навчаючи кожну з них кілька разів і порівнюючи отримані результати. Головним критерієм вибору в цих випадках є контрольна похибка. При цьому застосовується правило, згідно з яким з двох нейронних мереж з приблизно рівними контрольними похибками слід вибирати ту, яка простіше. p align="justify"> Необхідність багаторазових експериментів веде до того, що контрольне безліч починає відігравати ключову роль у виборі нейронної мережі, тобто бере участь у процесі навчання. Тим самим його роль як незалежної критерію якості моделі послаблюється, оскільки при великому числі експериментів виникає ризик перенавчання нейронної мережі на контрольному множині. p align="justify"> Для того, щоб гарантувати надійність обраній моделі мережі, резервують ще тестове безліч спостережень. Підсумкова модель тестується на даних з цієї множини, щоб переконатися, що результати, досягнуті на навчальному та контрольному множинах, реальні. При цьому тестове безліч має використовуватися тільки один раз, інакше воно перетвориться на контрольне безліч. p align="justify"> Отже, процедура побудови нейронної мережі складається з наступних кроків:
. Вибрати початкову конфігурацію мережі у вигляді одного шару з числом нейронів, рівним половині загальної кількості входів і виходів. p align="justify">. Навчити мережу і перевірити її на контрольному безлічі, додавши в разі потреби додаткові нейрони і проміжні шари. p align="justify">. Перевірити, чи не перенавчитися Чи мережу. Якщо має місце ефект перенавчання, то справити реконфігурацію мережі. p align="justify"> Для того щоб проектована мережа успішно вирішувала завдання, необхідно забезпечити показність навчає, контрольного і тестового безлічі. Принаймні, найкраще постаратися зробити так, щоб спостереження різних типів були представлені рівномірно. Добре спроектована мережа повинна мати властивість узагальнення, коли вона, будучи навченої на деякій множині даних, набуває здатність видавати правильні результати для досить широкого класу даних, у тому числі і непредставлених при навчанні. p align="justify"> Інший підхід до процедури навчання мережі можна сформулювати, якщо розглядати її як процес, зворотний моделюванню.
У цьому випадку потрібно підібрати такі значення ваг і зміщень, які забезпечували б необхідне відповідність між входами і бажаними значеннями на виході. Така процедура навчання носить назву процедури адаптації і досить широко застосовується для налаштування параметрів нейронних мереж. p align="justify"> Типово для мереж з прямою передачею сигналів в якості критерію навчання використовується функціонал, що являє собою суму квадратів помилок між виходами мережі та їх цільовими значеннями:
В
де Q - обсяг вибірки; q - номер вибірки; i - номер виходу;
Метою навчання мережі