Міністерство освіти і науки РФ
Федеральне державне бюджетне освітня установа вищої професійної освіти
«Вятський державний гуманітарний університет»
ФАКУЛЬТЕТ ІНФОРМАТИКИ, МАТЕМАТИКИ І ФІЗИКИ
Кафедра прикладної математики та інформатики
Курсова робота
Аналіз тональності текстів на основі ДСМ-методу
Виконав Вичегжанін Сергій Володимирович
Науковий керівник Котельников Євген В'ячеславович
Кіров 2013
Зміст
Введення
Глава 1. Завдання аналізу тональності текстів
.1 Поняття аналізу тональності тексту
.1.1 Визначення
.1.2 Історія
.1.3 Постановка завдання
.1.4 Застосування
.2 ДСМ-метод
.2.1 Схема методу
.2.2 Опис методу
.2.3 Алгоритм пошуку перетинань
.3 N-кратний ковзний контроль
.4 Метрики якості
.4.1 Правильність і помилковість
.4.2 Точність і повнота
Глава 2. Практичне дослідження ДСМ-методу
.1 Програмна реалізація
.1.1 Інтерфейс користувача
.1.2 Вхідні дані
.1.3 Вихідні дані
.2 Текстова колекція
.3 Експерименти і результати
.3.1 Оцінка якості аналізу тональності
.3.2 Оцінка часу роботи програми
Висновок
Бібліографічний список
Додаток
Введення
У мережі Інтернет міститься величезна кількість різноманітних текстів, авторами яких є звичайні користувачі. Це можуть бути статті в блогах, відгуки на продукти, повідомлення в соціальних мережах і т. п. У цьому контенті міститься велика кількість цінної інформації.
У комп'ютерній лінгвістиці існує окремий напрямок обробки природно-мовних текстів - аналіз тональності текстів (sentiment analysis). Тональністю називається емоційна оцінка, яка виражена в тексті. Актуальність задачі визначення тональності полягає в тому, що на основі текстової інформації можна оцінити ставлення суспільства до якогось продукту або події. Наприклад, за допомогою даного аналізу можна оцінити успішність рекламної кампанії, політичних та економічних реформ; виявити ставлення преси та ЗМІ до певної персони, до організації, до події; визначити, як ставляться споживачі до певної продукції, до послуг, до організації. Така інформація становить значний інтерес для маркетологів, соціологів, економістів, політологів і всіх тих фахівців, діяльність яких залежить від думок людей.
Існують два основні підходи до вирішення завдання аналізу тональності тексту: на основі словників і на основі машинного навчання. У першому підході використовуються словники, що містять слова і пропозиції, для яких відома оцінка вираженої в них тональності. Цей підхід ефективний при використанні великих словників, але процес їх складання досить трудомісткий. Другий підхід полягає у створенні автоматичного класифікатора, який використовує колекцію навчальних текстів. В основі цього підходу лежать статистичні методи. Підхід ефективний при наявності великої колекції навчальни...