Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Новые рефераты » Розробка алгоритму та програми автоматичного оброблення матеріалів для інформаційного ресурсу

Реферат Розробка алгоритму та програми автоматичного оброблення матеріалів для інформаційного ресурсу





кому варіант тесту, перевіряється не просто знання даного тексту, але знання предметної області в цілому. Однак тут перед нами постає відразу кілька складнощів. По-перше на практиці, в список ключових слів, все одно потрапляють сторонні слова, що не мають відношення до спеціальної тематики тексту. Це відбувається через недостатню кількість еталонних текстів для звірки. По-друге у списку ключових слів знаходяться слова, що відносяться до різних частин мови, в різному числі і в різних склонениях. З цього випливає проблема, при якій з чотирьох варіантів, даних для вибору, логічно вірним буде лише справжній варіант, інші три будуть не підходити для підстановки.

Розглянемо приклад. Нехай задано пропозицію, в якому присутня ключова словоформа, виділена прописом.

Проте пізніше фізики переконалися в тому, що позитивну електрику, зрештою, теж повинно розглядатися як складається з окремих абсолютно однакових часток - протонів.

Тепер видалимо слово протонів, вказавши його у варіантах відповіді, і дамо на вибір три інших, випадковим чином обраних ключових слова.

Проте пізніше фізики переконалися в тому, що позитивну електрику, зрештою, теж повинно розглядатися як складається з окремих абсолютно однакових часток - [......].

. протонів

. коефіцієнта

. кристалах

. завуальована

У наведених вище варіантах суджень, формованих у вигляді процедур пошуку смислової словоформи, чітко проглядається вірне слово - протон. Слово протонів є іменником, множини, родового відмінка. Це слово підходить за змістом, по закінченню, і з фізичного сприйняття контексту. Другий варіант відповіді коефіцієнта також є іменником в родовому відмінку, проте в однині. Третій варіант також, як і перші два - іменник, і так само як і слово «протонів, у множині. Однак це слово представлено у місцевому відмінку, що також буде відрізнятися від першого варіанту. Четвертий варіант є дієсловом, і фактично не має відношення до тематики тексту, проте є рідкісним у вживанні словом, яке не потрапило в еталонні, і стало ключовим, для вихідного тексту.

Тепер слід навести приклад того, якими мають бути варіанти відповідей, що б їх неможливо було підібрати, без знання тематики тексту.

Проте пізніше фізики переконалися в тому, що позитивну електрику, зрештою, теж повинно розглядатися як складається з окремих абсолютно однакових часток - [......].

. протонів

. нейтронів

. бозонів

. гравітонів

В вище описаному прикладі видно, що без знання основ квантової фізики, відповісти на питання тесту, досить таки проблематично. Для цього і необхідна угруповання ключових слів у таблицю, де вони будуть розділені за принципом взаємозамінності, для підстановки з правильним варіантом відповіді. Однак досить складно визначити всі характеристики слова в автоматичному режимі, без підключення баз даних спеціалізованих слів або технічних словників. Цю проблему, частково можна вирішити визначенням закінчення слів, які в більшості випадків відповідають за всі основні параметри слова, в тому числі за частина мови, рід, число ит.д. Видалення ж зі списку тих слів, які не мають безпосереднього відношення...


Назад | сторінка 32 з 44 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Розробка алгоритму роботи синтаксичного аналізатора тексту, а також бази да ...
  • Реферат на тему: Розпізнавання ключових слів у потоці мовлення за допомогою фонетичного стен ...
  • Реферат на тему: Практика виділення ключових знаків журналістського тексту
  • Реферат на тему: Спочатку було ... слово
  • Реферат на тему: Слово "раз" як частина мови в сучасній російській мові