кому варіант тесту, перевіряється не просто знання даного тексту, але знання предметної області в цілому. Однак тут перед нами постає відразу кілька складнощів. По-перше на практиці, в список ключових слів, все одно потрапляють сторонні слова, що не мають відношення до спеціальної тематики тексту. Це відбувається через недостатню кількість еталонних текстів для звірки. По-друге у списку ключових слів знаходяться слова, що відносяться до різних частин мови, в різному числі і в різних склонениях. З цього випливає проблема, при якій з чотирьох варіантів, даних для вибору, логічно вірним буде лише справжній варіант, інші три будуть не підходити для підстановки.
Розглянемо приклад. Нехай задано пропозицію, в якому присутня ключова словоформа, виділена прописом.
Проте пізніше фізики переконалися в тому, що позитивну електрику, зрештою, теж повинно розглядатися як складається з окремих абсолютно однакових часток - протонів.
Тепер видалимо слово протонів, вказавши його у варіантах відповіді, і дамо на вибір три інших, випадковим чином обраних ключових слова.
Проте пізніше фізики переконалися в тому, що позитивну електрику, зрештою, теж повинно розглядатися як складається з окремих абсолютно однакових часток - [......].
. протонів
. коефіцієнта
. кристалах
. завуальована
У наведених вище варіантах суджень, формованих у вигляді процедур пошуку смислової словоформи, чітко проглядається вірне слово - протон. Слово протонів є іменником, множини, родового відмінка. Це слово підходить за змістом, по закінченню, і з фізичного сприйняття контексту. Другий варіант відповіді коефіцієнта також є іменником в родовому відмінку, проте в однині. Третій варіант також, як і перші два - іменник, і так само як і слово «протонів, у множині. Однак це слово представлено у місцевому відмінку, що також буде відрізнятися від першого варіанту. Четвертий варіант є дієсловом, і фактично не має відношення до тематики тексту, проте є рідкісним у вживанні словом, яке не потрапило в еталонні, і стало ключовим, для вихідного тексту.
Тепер слід навести приклад того, якими мають бути варіанти відповідей, що б їх неможливо було підібрати, без знання тематики тексту.
Проте пізніше фізики переконалися в тому, що позитивну електрику, зрештою, теж повинно розглядатися як складається з окремих абсолютно однакових часток - [......].
. протонів
. нейтронів
. бозонів
. гравітонів
В вище описаному прикладі видно, що без знання основ квантової фізики, відповісти на питання тесту, досить таки проблематично. Для цього і необхідна угруповання ключових слів у таблицю, де вони будуть розділені за принципом взаємозамінності, для підстановки з правильним варіантом відповіді. Однак досить складно визначити всі характеристики слова в автоматичному режимі, без підключення баз даних спеціалізованих слів або технічних словників. Цю проблему, частково можна вирішити визначенням закінчення слів, які в більшості випадків відповідають за всі основні параметри слова, в тому числі за частина мови, рід, число ит.д. Видалення ж зі списку тих слів, які не мають безпосереднього відношення...