1. Фундамент синтаксичного аналізу
Усі мовні засоби, якими володіє система для визначення синтаксичних понять, є або властивостями самого об'єкта, тобто пропозиції природної мови, або властивостями його елементів, тобто словоформ і знаків пунктуації (операторів). Синтаксичні поняття, по суті, являють собою функції, де параметрами служать мовні засоби, а самі функції використовуються в умовах граматичних стратегій чи правил. Нижче наведено п'ять мовних засобів синтаксичного аналізу:
. Словозмінні морфологічні засоби. Для мов з розвиненою морфологією, яким є російська, - це основний спосіб матеріалізації синтаксичних зв'язків. Словоформа w1 морфологічно залежить від словоформи w2 по морфологічної категорії C, якщо граммема (значення граматичної категорії) g категорії С, що характеризує w1, вибирається залежно від деякого властивості f словоформи w2. Словоформа w2 називається контролером морфологічної залежності, аw1 - її мішенню. 1 Іншими словами, один елемент пропозиції підлаштовується під інший, тобто приймає граматичну форму продиктовану другим елементом. Показником морфологічної залежності в російській служить флексія, тому що граммеми в російській зазвичай приписані флексії, що дозволяє в деяких випадках виявити залежність між двома словоформами, відсутніми в словнику, (наприклад, В«глок-ая куздра-аВ»). Якщо категорія C, по якій спостерігається морфологічна залежність, виражається у вершині, в наявності вершинний маркування, якщо ж ця категорія виражається в залежною словоформи - завісімостное маркування. 1 В російській мові граммеми багатьох форм омонімічни ('ночі' = [[рд., дт., пр., од.], [ім., вн., мн.]] - омонімія числа і відмінка), що створює певні труднощі в процесі аналізу. Неоднозначність граммем в ході автоматичного синтаксичного аналізу іноді призводить до виникнення синтаксичної омонімії та побудові альтернативного синтаксичного варіанта (графа синтагм). Відмінкова омонімія з номінатівом часто призводить до неоднозначного визначення правої межі сегменту і, як наслідок, до побудови альтернативної структури сегментації (графа сегментів). Парадокс або скоріше взаємовплив двох рівнів аналізу морфологічного і синтаксичного полягає в тому, що граммема, будучи ефективним засобом пошуку морфологічної залежності, яка служить одним із способів реалізації синтаксичного відносини, може бути однозначно проинтерпретирована тільки внаслідок фіксації цього відношення. p align="justify">. Селективні ознаки: класифікують (селективні) ознаки приписуються лексемам в граматичному словнику, на відміну від граммем, які обчислюються, виходячи з парадигматичного класу, для кожної словоформи на етапі морфологічного аналізу. Найбільш важливою для синтаксису є класифікація лексем по категоріальним (частеречного) ознаками: іменник, дієслово, прикметник, і т.д. Існує і більш докладний поділ на субкатегоріальн...