Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Курсовые обзорные » Аналіз методів автоматичної класифікації документів

Реферат Аналіз методів автоматичної класифікації документів





дним з найбільш ефективних класифікаторів, однак обчислення матриці призводить до високих обчислювальних витрат.


4.6 Штучні нейронні мережі


Штучна нейронна мережа являє собою набір взаємозалежних нейронів. Кожен нейрон являє собою елементарний перетворювач вхідних сигналів у вихідні. Вихідні сигнали обчислюються як функція від вхідних сигналів. Зв'язки між нейронами мають ваги, а самі нейрони - один з декількох стандартних алгоритмів поведінки, обираний розробником. Як правило, передавальні функції всіх нейронів у мережі фіксовані, а ваги є параметрами мережі і можуть змінюватися. Деякі входи нейронів позначені як зовнішні входи мережі, а деякі виходи - як зовнішні виходи мережі. Передаючи на вхід мережі певний набір сигналів, ми отримуємо певний набір сигналів на виході. p align="justify"> Навчання мережі зводиться до подачі на її входи спеціально підібраних сигналів, для яких заздалегідь відомий необхідний відповідь, який повинен бути отриманий на виходах мережі. У процесі навчання, проводиться коригування параметрів мережі таким чином, що б мережу видавала саме цей, заздалегідь відомий, відповідь. p align="justify"> Текстовий класифікатор на основі нейронних мереж - це мережа елементів, яку утворюють вхідні елементи представлені термінами документа, вихідні елементи, представлені категоріями, і зв'язки між елементами, що визначають ставлення залежності і помічені вагами.

Найпростіший тип нейронних мереж - персептрон. В алгоритмі персептрона спочатку для категорії всі ваги инициализируются одним і тим же можливим значенням. Після класифікації першого документа, представленого вагами термінів, перевіряється результат. Якщо він коректний, ваги класифікатора залишаються незмінними. В іншому випадку ваги класифікатора модифікуються доти, поки не буде отриманий коректний результат. Корекція відбувається таким чином: якщо є позитивний приклад категорії, то ваги активних термінів документа (тобто тих, для яких), В«просуваютьсяВ» збільшенням їх значення на певну фіксовану величину, звану ступенем навчання, інакше ті ж ваги В«знижуютьсяВ» на ту ж величину [3].

Загалом персептрони здатні досягати досить високої якості класифікації, проте їх важко застосовувати для великого масиву документів, оскільки при цьому різко зростають витрати обчислювальних потужностей на їх навчання [3].


4.7 Класифікатори на основі прикладів. Метод k найближчих сусідів


Класифікатори на основі прикладів не намагаються знайти явний профайл для кожній категорії, як це робить, наприклад, класифікатор Rocchio, а засновують процес вибору категорії на порівнянні відстаней між оброблюваним документом і документами навчальної множини. Рішення про те, як узагальнити висновок за межами навчальних даних, відкладається до тих пір, поки в систему не вступить документ, ...


Назад | сторінка 12 з 16 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Особливості початкового навчання плаванню дітей молодшого шкільного віку з ...
  • Реферат на тему: Розробка ретранслятора інфрачервоних сигналів для домашньої мережі
  • Реферат на тему: Однорангові мережі та мережу на основі виділеного сервера. Експертна систе ...
  • Реферат на тему: Розрахунок розподільчої мережі напругою 0,4 кВ і мережі 10 кВ з односторонн ...
  • Реферат на тему: Пошук інформації в мережі Інтернет для використання в процесі навчання