дного слова, якщо воно повторювалося в реченні-питанні. В якості метрик по всій колекції питань слід брати середні точність і повноту.
.3 Результати простого експерименту
На колекції російськомовних питань було поставлено експеримент з дослідження тривіальної реалізації модуля проставляння семантичного тега. Модуль використовував таблицю пошуку слів у питанні для вибору того чи іншого семантичного тега. Нижче перераховані всі правила роботи модуля (Таб.4.1.).
Таблиця 4.1.
Правила роботи тривіального модуля аналізу питань російською мовою.
СловоТэгСловоТэгСкачатьURLподарить | подарокProductКтоPersonЛіYes / NoКакRecipeопределеніе | що такоеDefinitionГдеLocationцена | вартість | скільки стоітMoneyкогда | в якому годуDateвозраст | скільки летAge
Експеримент показав, що така реалізація модуля аналізу питання дає помилку 67%. На момент написання статті автори не проводили експериментів з виділенням фокуса.
Висновок
У задачі автоматичної відповіді на питання на природній мові першим етапом роботи системи є аналіз питання. Якість роботи модуля аналізу питання суттєво впливає на якість роботи системи в цілому (3). Зарубіжними дослідниками були поставлені експерименти з аналізу запитань англійською мовою, причому різні дослідницькі групи, використовували різні методи вирішення цієї першого завдання.
У даний роботі виконано огляд існуючих методів для англійської мови, розроблена процедура оцінки методів, оброблена вручну тестова колекція російськомовних питань і поставлений експеримент для дослідження деякої тривіальної реалізації модуля. Автори планують зібрати повний конвеєр типовий питально-відповідної системи з тривіально реалізованих модулів, який стане експериментальним майданчиком для дослідження більш ефективних методів.
семантичний тег питання шаблон
Список літератури
1. Carol Peters. What happened in CLEF 2009 Introduction to the Working Notes.// Proceedings of CLEF 2009. URL: # «justify"> 2. Російський семінар з Оцінкою Методів Інформаційного Пошуку. Праці четвертого російського семінару РОМІП'2006. СПб.: НУ ЦСМ, 2006, 274 с.
3. Abraham Ittycheriah. A Statistical Approach For Open Domain Question Answering / / Advances in Open Domain Question Answering. Springer Netherlands, 2006. Part 1. Vol.32.
4. Burger, J. та ін Issues, tasks and program structures to roadmap research in question & answering (Q & A). NIST DUC Vision and Roadmap Documents, 2001. URL: # «justify"> 6. Segalovich I. A fast morphological algorithm with unknown word guessing induced by a dictionary for a web search engine. MLMTA, 2003.
7. Пошукова система AskNet [Електронний ресурс]: Перелік питань, підтримуваних системою AskNet для проведення семантичного пошуку. URL: # «justify">. Азарова І. В. та ін Розробка комп'ютерного тезауруса російської мови типу WordNet / / Доповіді наукової конференції «Корпусні лінгвістика та лінгвістичні бази даних»/Под ред. А.С. Герда. СПб., 2002. С. 6-18.
9. Semantic Analyzer group blog [Електронний ресурс]. URL: semantican...