Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Курсовые обзорные » Розробка алгоритму роботи синтаксичного аналізатора тексту, а також бази даних синтаксичних правил російської мови

Реферат Розробка алгоритму роботи синтаксичного аналізатора тексту, а також бази даних синтаксичних правил російської мови





1. Фундамент синтаксичного аналізу


Усі мовні засоби, якими володіє система для визначення синтаксичних понять, є або властивостями самого об'єкта, тобто пропозиції природної мови, або властивостями його елементів, тобто словоформ і знаків пунктуації (операторів). Синтаксичні поняття, по суті, являють собою функції, де параметрами служать мовні засоби, а самі функції використовуються в умовах граматичних стратегій чи правил. Нижче наведено п'ять мовних засобів синтаксичного аналізу:

. Словозмінні морфологічні засоби. Для мов з розвиненою морфологією, яким є російська, - це основний спосіб матеріалізації синтаксичних зв'язків. Словоформа w1 морфологічно залежить від словоформи w2 по морфологічної категорії C, якщо граммема (значення граматичної категорії) g категорії С, що характеризує w1, вибирається залежно від деякого властивості f словоформи w2. Словоформа w2 називається контролером морфологічної залежності, аw1 - її мішенню. 1 Іншими словами, один елемент пропозиції підлаштовується під інший, тобто приймає граматичну форму продиктовану другим елементом. Показником морфологічної залежності в російській служить флексія, тому що граммеми в російській зазвичай приписані флексії, що дозволяє в деяких випадках виявити залежність між двома словоформами, відсутніми в словнику, (наприклад, В«глок-ая куздра-аВ»). Якщо категорія C, по якій спостерігається морфологічна залежність, виражається у вершині, в наявності вершинний маркування, якщо ж ця категорія виражається в залежною словоформи - завісімостное маркування. 1 В російській мові граммеми багатьох форм омонімічни ('ночі' = [[рд., дт., пр., од.], [ім., вн., мн.]] - омонімія числа і відмінка), що створює певні труднощі в процесі аналізу. Неоднозначність граммем в ході автоматичного синтаксичного аналізу іноді призводить до виникнення синтаксичної омонімії та побудові альтернативного синтаксичного варіанта (графа синтагм). Відмінкова омонімія з номінатівом часто призводить до неоднозначного визначення правої межі сегменту і, як наслідок, до побудови альтернативної структури сегментації (графа сегментів). Парадокс або скоріше взаємовплив двох рівнів аналізу морфологічного і синтаксичного полягає в тому, що граммема, будучи ефективним засобом пошуку морфологічної залежності, яка служить одним із способів реалізації синтаксичного відносини, може бути однозначно проинтерпретирована тільки внаслідок фіксації цього відношення. p align="justify">. Селективні ознаки: класифікують (селективні) ознаки приписуються лексемам в граматичному словнику, на відміну від граммем, які обчислюються, виходячи з парадигматичного класу, для кожної словоформи на етапі морфологічного аналізу. Найбільш важливою для синтаксису є класифікація лексем по категоріальним (частеречного) ознаками: іменник, дієслово, прикметник, і т.д. Існує і більш докладний поділ на субкатегоріальн...


сторінка 1 з 22 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Розробка алгоритму синтаксичного аналізу оператора виведення printf мови C ...
  • Реферат на тему: Конвертер програми з підмножини мови Сі в Паскаль з використанням LL (1) ме ...
  • Реферат на тему: Розробка синтаксичного розпізнавача обчислюваного оператора переходу мови F ...
  • Реферат на тему: Процес формування синтаксичного ладу мовлення молодших школярів
  • Реферат на тему: Мовні засоби вираження категорії ввічливості в сучасних німецькій та російс ...