могою набору попередньо класифікованих документів, що характеризуються однією або більше категоріями. Перевагою є висока ефективність і значне збереження досвіду експертів.
Проблема автоматичного розпізнавання думок у тексті виявилася предметом активних досліджень за кордоном порівняно недавно - в 2000-х рр.. У Росії таких робіт до останнього часу було вкрай мало; тільки в 2012 році оцінка тональності тексту була обрана однією з головних тем конференції з комп'ютерної лінгвістики «Діалог - 2012» [10].
1.1.3 Постановка завдання
Метою аналізу тональності є знаходження думок у тексті та визначення їх властивостей. Існують різні завдання залежно від досліджуваних властивостей текстів, наприклад, визначення автора думки, тобто кому належить це думка; визначення теми, тобто про що йдеться в думці; визначення тональності, тобто позиція автора щодо об'єкту, про який йдеться в думці.
Перед тим, як сформулювати узагальнену постановку задачі аналізу тональності, формально визначимо поняття думки. Відповідно до [3] думка позначимо безліччю виду
, (1)
де (entity) - сутність (об'єкт), по відношенню до аспектів якій виражається думку; (Aspect) - i-й аспект сутності (властивість об'єкта), по відношенню до якого виражається думку; (Sentiment) - тональність думки стосовно i-му аспекту сутності; (Holder) - виразник думки (суб'єкт); (Time) - час висловлення думки. Якщо думка виражається по відношенню до сутності в цілому, а не до окремого її аспекту, то встановлюється.
Узагальнену задачу аналізу тональності можна сформулювати в наступному вигляді: у заданому тексті знайти всі думки виду (1).
Наведемо кілька основних варіантів завдань аналізу тональності, описаних в роботі [9].
. Визначення виключно тональності тексту.
Дане формулювання завдання аналізу тональності є найбільш простий. Розглядається тільки тональність думки, яке виражене в тексті (часто передбачається, що воно єдине); при цьому інші компоненти безлічі (1) не виділяються або вважаються відомими.
Зазвичай тональність представлена ??певної шкалою. Виділяють такі типи шкал:
) двозначна шкала. Шкала тональності має тільки два значення-позитивна тональність і негативна.
) Тризначна шкала. До попереднім двома варіантами додається третє значення - нейтральне, яке може позначати або відсутність тональності, або одночасне наявність як позитивною, так і негативною тональності.
) Багатозначна шкала. Шкала тональності має більше 3 значень. Існує безліч варіантів таких шкал, що відрізняються кількістю значень тональності і наявністю нейтрального значення.
. Визначення тональності, суб'єкта та об'єкта
В даному варіанті завдання крім тональності думки визначається виразник думки, суб'єкт і об'єкт, по відношенню до якого виражається думку. Вираз (1) в даному випадку приймає вигляд:
.
Для вирішення завдання в такій постановці крім методів визначення тональності потрібно також застосування методів вилучення сутностей з тексту.
. Визначення думки в цілому
Думка розглядається як повне вираження (1), тобто в порівнянні з попереднім варіантом окрім виділення сутності (об'єкта думки) потрібно визначення її аспектів.
1.1.4 Застосування