justify"> Аналіз тональності тексту є одним з перспективних напрямків комп'ютерної лінгвістики. Цей напрямок штучного інтелекту дозволяє витягувати різноманітну інформацію, що знаходиться у формі тексту на природній мові.
Автоматичне розпізнавання тональності текстів знаходить широке застосування в різних сферах діяльності людини. Наведемо кілька прикладів з роботи [9].
. Маркетингові дослідження. Проводяться для різноманітних цілей, включаючи вивчення споживчих переваг, вимір ступеня задоволення потреб споживачів, визначення ефективності розповсюдження продуктів або послуг.
2. Фінансові ринки. В роботі [1] говориться, що про кожного акціонерному товаристві існують численні публікації новин, статті, блоги та повідомлення в Твіттері. Система аналізу тональності може використовувати ці джерела для знаходження статей, в яких обговорюються такі товариства, і витягувати відгуки, що дозволить створити автоматичну торгову систему. Однією з таких систем є «The Stock Sonar» (<# «justify"> 1.2 ДСМ-метод
1.2.1 Схема методу
На рис. 1 зображена схема ДСМ-методу класифікації текстів.
Рис. 1 - Схема ДСМ-методу класифікації текстів
Для реалізації ДСМ-методу використовуються три основних компоненти: словник, навчальна колекція текстів і класифікуються тексти. Словник і навчальна колекція використовуються для формування безлічі гіпотез, що характеризують приналежність тексту до певного класу. Гіпотези порівнюються з фрагментами класифікуються текстів на предмет збігу. За результатами порівняння робиться висновок про емоційну категорії цих текстів.
Словник може бути сформований як автоматично (містить без виключення всі слова з навчальної колекції), так і вручну (містить тільки слова, що мають явно виражене емоційне забарвлення).
Навчальна колекція складається з текстів, тональність яких відома. Що класифікується колекція містить тексти, тональність яких невідома і її потрібно визначити.
1.2.2 Опис методу
ДСМ-метод - це метод автоматичного породження гіпотез. Був запропонований В. К. Фіном наприкінці 1970-х рр.. Свою назву метод отримав від ініціалів відомого англійського філософа, логіка і економіста Джона Стюарта Мілля. ДСМ-метод являє собою формалізацію правдоподібних міркувань, яка дозволяє на основі аналізу наявних даних формувати гіпотези про те, якими властивостями можуть володіти розглянуті об'єкти. ДСМ-метод - це синтез трьох пізнавальних процедур - емпіричної індукції, структурної аналогії і абдукції. У даній роботі ми розглянемо тільки два етапи цього методу - етапи індукції та аналогії.
Відповідно до [8] будемо використовувати такі умовні позначення: Про - безліч об'єктів предметної області, Р b> - безліч властивостей цих об'єктів, З - безліч характеристик об'єктів, що є можливими причинами властивостей, V - безліч істиннісних оцінок об'єктів.
На вхід ДСМ-метод подається безліч досліджуваних об'єктів і інформація про наявність або відсутність у них певних властивостей. Крім того, є ряд цільових ознак, кожен з яких розбиває вихідне безліч об'єктів на чотири непер...