ішення конфліктів впливає на якість визначення тональності текстів. Кращі результати показала функція вирішення конфліктів на основі сумарної кількості гіпотез.
2.3.2 Оцінка часу роботи програми
У процесі проведення експериментів було заміряні фактичний час роботи програми-аналізатора в залежності від кількості навчальних текстів. Оцінка тимчасової складності програми в цілому визначається алгоритмом пошуку перетинань текстів. Так як завдання пошуку спільних фрагментів текстів є NP-повною, то час роботи програми із збільшенням числа навчальних текстів росте по експоненційної залежності. При проведенні експерименту по виміру часу використовувався ручний словник з прикметниками. На рис. 6 зображено графік залежності часу роботи програми від кількості текстів.
Рис. 6 - Час роботи програми-аналізатора
За допомогою методу найменших квадратів побудовано два наближення досліджуваної залежності (рис. 6). Для розглянутого набору вхідних даних найбільш точною виявилася експонентна залежність.
У табл. 9 наведено час роботи програми для різних частин мови і словників, а на рис. 7 і рис. 8 ці дані представлені у вигляді діаграм.
Таблиця 9 - Час роботи програми-аналізатора (при використанні функції вирішення конфліктів на основі кількості гіпотез)
ПараметриВремя роботи, мінПараметриВремя роботи, мінЧасть речіСловарьЧасть речіСловарьПріл.Авт.0, 145Пріл. + Гл.Авт.1, 006Ручной0, 082Ручной0, 210Сущ.Авт.0, 705Сущ. + Гл.Авт.3, 505Ручной0, 035Ручной0, 104Гл.Авт.0, 230Пріл. + Сущ. + Гл.Авт.9, 128Ручной0, 045Ручной0, 396Пріл. + Сущ.Авт.2, 381Все частини речіАвт.98, 880Ручной0, 159Ручной0, 633
а
б
Рис. 7 - Час роботи програми-аналізатора (в мс): а - автоматичний словник; б - річний словник
На рис. 8 зображена діаграма часу роботи програми з ручним словником в процентному відношенні до часу роботи з автоматичним словником.
Рис. 8 - Час роботи програми з ручним словником в процентному відношенні до часу роботи з автоматичним словником
Отримані результати показують, що при використанні ручного словника швидкість роботи програми істотно більше, ніж у випадку автоматичного словника. При цьому якість розпізнавання тональності вище.
Висновок
У процесі виконання курсової роботи було вивчено ДСМ-метод автоматичного породження гіпотез, застосовуваний для аналізу тональності текстів, виконана програмна реалізація цього методу та проведено ряд комп'ютерних експериментів. Дослідження було спрямоване на виявлення впливу компонентів ДСМ-методу на якість розпізнавання тональності текстів. Вивчався вплив словника, частин мови та функції вирішення конфліктів. Аналіз отриманих результатів дозволив зробити наступні висновки:
o словник, складений вручну, в порівнянні з автоматичним словником дає поліпшення значення метрик якості внаслідок відсікання безлічі слів з нейтральною забарвленням, а також збільшує швидкість роботи програми;
o найбільший внесок у якість визначення тональності вносять імена прикметники в...