Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Новые рефераты » Питально-відповідна система

Реферат Питально-відповідна система





entifyWho, why, whom, whenquestion wordWherequestion word + main verbHowquestion word plus next word if it seeks an count attribute + headword of firstnoun clusterquestion word plus the next word if it seeks an attributeif question seeks a methodology, then just question word

Очевидними недоліками такого підходу є:

1. Практична неможливість покрити значиму частину реальних питань користувачів. Набір питань підбирається так, щоб обробити конкретний набір тестових завдань. Вийти за межі цього покриття «незручним питанням» досить легко.

2. Після ряду експериментів стає очевидно, що зв'язок між питальними словами і семантичними тегами не так прямолінійна. Так слово «хто» може сигналізувати і про персону, і про організацію, і про країну, і про народ (наприклад, в питанні «Хто виграв війну?").

. Виділення фокусу на основі шаблонів також працює в дуже обмежених випадках.

Метод шаблонів успішно використовувався в системах, учувствовать в TREC - 8 (1999), в якому організатори підготували питання для доріжки QA вручну. Однак, вже в TREC - 9 (2000) було запропоновано завдання на основі реальних запитів користувачів і ті системи, які не застосували інші методи аналізу питання, помітно відстали від адаптувалися лідерів.


3.2 Синтаксичні шаблони питань


Для виділення фокусу питання наступним кроком після символьних шаблонів став метод синтаксичних шаблонів. В основі методу лежить припущення, що фокус питання часто знаходиться в певному синтаксичному відношенні з питальним словом, м.б. не в одному, але набір варіантів цих відносин обмежений. Якщо виконати синтаксичний розбір пропозиції, то вийде синтаксичне дерево (Рис.3.). Цей приклад наочно демонструє, що для роботи на колекції реальних питань користувачів система в т.ч. повинна справлятися з друкарськими помилками і орфографічними помилками.

Ось приклад синтаксичного шаблону для розпізнавання фокуса, використовуваного в системі OpenEphyra:


(ROOT (SBARQ (WHNP (WP What)) (SQ (VP (VBZ is) (NP (NP (DT the) (NN name)) (PP (IN of) (* NP xx )))))))


Тут в скобочной нотації задано синтаксичне дерево зі словами або їх синтаксичними / морфологічними мітками у вузлах. Такий шаблон дерева порівнюється з реальним деревом питання і, в разі збігу, фокусом вважаються члени пропозиції, відповідні позиції xx в шаблоні.


Рис.3. Синтаксичне дерево, побудоване системою SemanticAnalyzer (12., 1) для питання nqa2009_6368 «як відключити перехоплення клавіатури?»

3.3 Статистика вживання слів у питаннях


У роботі (3) запропонований метод автоматичного навчання статистичної моделі для проставляння семантичного тега. Для кожного питання з навчальної вибірки виділяють три «потоку» ознак (features stream):

1. всі слова як є і додаткові мітки до деяких з них (наприклад, мітка bqw означає, що питальне слово стоїть на початку речення);

2. мітки частин мови слів і порядкові номери слів у реченні;

3. Фокусні слова з гіперонімом, згідно лексичному тезаурусу.

Нижче наведені ознаки для одного питання англійською мовою (Т...


Назад | сторінка 5 з 8 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Створення шаблонів документів засобой Microsoft Word
  • Реферат на тему: Питання вивчення словосполучень. Основні питання синтаксису пропозиції
  • Реферат на тему: Дискусійні питання про правову природу стадії виконання вироку при вирішенн ...
  • Реферат на тему: Розробка системи автоматичного заповнення анкети у форматі MS Word
  • Реферат на тему: Додаткові компенсації для працівників: питання обліку