ведені приклади аналізу питань із завдань РОМІП 2009, виконаного вручну (таб.2.1., збережена орфографія реальних запитів ).
Таблиця 2.1.
Приклади аналізу питань із завдань РОМІП 2009. (3., 12)
№ Питання, жирним шрифтом виділено фокусСемантіческій тегnqa2009_6368как відключити перехоплення клавіатури? Recipenqa2009_7185сколько варто почен гніздо у телефону Соні Ерікссон? Moneynqa2009_6425в яких релігіях як розглядається карма? Definitionnqa2009_3123отечественная війна хто з ким? Countrynqa2009_8557являются чи горища пожежонебезпечними приміщеннями? Yes / Nonqa2009_7801какое колличество циклів читання / запису предусмотренноCardinalкомпанией fujifilm для картриджів стандарту lto 4? nqa2009_8763когда почнеться розпродаж в Меге? Datenqa2009_9150во скільки захід сонця 27 лютого? Timenqa2009_8754когда можна зводити кішок? Agenqa2009_6797какіе в Тамбові є студії звукозапису?? Organization
Таксономія семантичних тегів зазвичай вибирається розробниками системи так, щоб покрити більшу частину питань до системи. Наступна таксономія була запозичена з (3) і доповнена авторами кількома тегами, щоб краще покривати тестову колекцію питань РОМІП 2009: Age, Disease, Ordinal, Recipe, Animal, Duration, Organ, Salutation, Areas, Event, Organization, Substance, Attraction, Geological objects, People, Term (Reverse definition), Cardinal, Law, Percent, Time, Company-roles, Location, Person, Title-of-work, Country, Manner, Phrase (NNP), URL, Date, Measure, Plant, Weather, Date-Reference, Money, Product, Yes / No, Definition, Occupation, Reason .
3. Методи аналізу питань
У цьому розділі дано короткий огляд існуючих методів аналізу питань.
.1 Символьні шаблони питань
Найпростішим способом визначити тег або фокус в питанні є підготовка шаблонів (регулярних виразів) для розпізнавання поширеного питального обороту. Нижче наведені деякі правила, використовувані в системі OpenEphyra для англійської мови (Таб.3.1.).
Таблиця 3.1.
Символьні шаблони питань з системи OpenEphyra (10)
СемантіческійРегулярное вираз вопросаТегNEaward (what | which | name | give | tell) (. * )?(accolade|award|certification|decoration|honoring|honouring|medal|prize|reward)NEbird(what|which|name|give|tell) (. *)? BirdNEbirthstone (what | which | name | give | tell) (. *)? BirthstoneNEcolor (what | which | name | give | tell) (. *)? (Color | colour) NEconflict (what | which | name | give | tell) (. * )?(battle|conflict|conquest|crisis|crusade|liberation|massacre|rebellion|revolt|revolution|uprising|war)NEdate(when|what|which|name|give|tell) (. *)? (Birthday | date | day) NEdate-century (when | what | which | name | give | tell) (. *)? Century
Для виділення фокуса в роботі (3) використовувалися такі шаблони, які використовують у т.ч. і морфологічну інформацію (таб.3.2., англійською мовою):
Таблиця 3.2.
Приклади шаблонів для виділення фокусу питання англійською мовою (3)
Питальне словоШаблонWhat, which, name, list, question word + headword of first noun clusterid...