режі з найбільшою помилкою
· Отримання нейрона з найбільшою помилкою серед сусідів обраного нейрона
· Обчислення загальної помилки картки
· Settings - містить налаштування мережі, такі як максимальний вік зв'язків нейрон-нейрон, період створення нових нейронів (обчислюваний кількістю пройдених епох навчання), множники перерахунку помилок нейронів і показник функції залежності максимальної кількості нейронів у мережі від кількості документів.
7.2 Пакет main.trainer
Пакет відповідає за реалізацію модифікованого алгоритму розширюється нейроннго газу, застосовуваного для навчання мережі. Основним класом, наданим даним пакетом є клас NeuralGasAlgo, що надає метод train (dataSet). Параметр dataSet являє собою навчальну вибірку, яка застосовується в даній епосі навчання; метод здійснює додавання нового нейрона в мережу (за умови що номер ітерації кратний періоду додавання нейрона), вибір перших двох найближчих нейронів до поточного вектору вибірки, і передачу розрахунків в метод handleClusters (), після чого проводить перерахунок помилок нейронів мережі.
Метод handleClusters () встановлює і розриває зв'язки між нейронами у відповідності з методикою алгоритму розширюється нейронного газу: встановлює зв'язок між нейроном-переможцем і наступним за ним нейроном по близькості до поточного вектору, перераховує помилку нейрона-переможця і виробляє його зміщення за правилами модифікованого алгоритму.
7.3 Пакет main.search
Пакет містить клас Search, який відповідає за обробку пошукових запитів користувача і видачу результатів пошуку. Надає метод int [] search (request), який і здійснює пошук за індексованими документам, використовуючи API класу Network. Параметр request являє собою список термів і керуючих символів, введених користувачем системи і обробляється методом Search з використанням регулярних виразів для подальших маніпуляцій з отриманим набором виділених термів і керуючих символів. Далі метод робить переклад набору термів пошукового запиту в векторне подання, використовуючи ті ж правила, що і при побудові векторної моделі для документів, після чого проводить пошук найближчого кластера до отриманого вектору. Вміст кластера (також, можливо, вміст його топологічних сусідів, в порядку ранжирування за зростанням відстані від вектора пошукового запиту, якщо менше, ніж необхідний мінімальний число файлів) у вигляді номерів файлів становить результат роботи функції - масив значень типу int.
Далі результат може бути оброблений з метою представлення даних у форматі JSON, який буде містити запитану користувачем інформацію документах, що забезпечує читабельність і сумісність з веб-інтерфейсом (JSON легко створюється на серверної частини, без використання додаткового функціоналу , також легко десеріалізуется на клієнтської частини, яка представляється веб-інтерфейсом і містить вбудовані засоби для роботи з цим форматом).
7.4 Пакет main.test
Призначенням даного пакету є тестування і налагодження роботи системи. З використанням пакета візуального інтерфейсу awt в ньому реалізовані наступні класи:
· MainCanvas extends Canvas - являє собою візуальний компонент, відповідальний за промальовування елементів вибраної мережі і внутрішню підтримку актуальності контексту малювання на даному елементі (контекст малювання може бути втрачений при виникненні певних подій, що виникають в операціоноой системі; компонент займається відстеженням цих подій і відновленням контексту при необхідності).
· SOMFrame extends JFrame - клас, відповідальний за створення фрейма, на якому будуть представлені візуалізовані дані про вибраної мережі. Є контейнером для екземпляра класу MainCanvas і надає останньому місце в ієрархії візуальних компонентів. Містить в собі обробники подій клавіатури і миші, необхідних для роботи з візуальним інтерфейсом даного пакета. Надає можливість виведення статистики про вибраної мережі, що дозволяє оцінити правильність налаштування параметрів системи і зробити відповідні зміни, якщо це потрібно.
Візуальне подання мережі релизована для моделі двовимірного простору ознак, і дозволяє наочно оцінити прінціни роботи мережі і вплив її параметрів на динаміку її компонентів, таких як нейрони і зв'язку нейрон-нейрон і нейрон-документ. Такий підхід надає можливість доповнити інформацію про мережі, отриману засобами статистичного аналізу та розширити розуміння отриманих результатів, аналіз яких дає можливість подальшої розробки та вдосконалення алгоритмів роботи мережі.
8. Налаштування параметрів пошукового механізму. Статистичний аналіз побуд...