ння для одного і того ж слова. Додаткові таблиці містять, як правило, список можливих варіантів змінюваних частин слів (в російській мові - закінчень) з відповідним їм значенням граматичних ознак.
У загальному випадку проводиться пошук всього слова в словнику словоформ, якщо слово не знайдене, від нього відділяється остання буква і виробляється повторний пошук. Так продовжується до тих пір, поки основа не буде знайдена або поки не залишиться букв. У разі вдалого пошуку зі словника витягуються варіанти частин мови, відповідних цій основі. Потім проводиться пошук в таблиці змінюваних частин слова. При цьому пропускаються варіанти відповідні частинам мови, до яких дана основа не може ставитися. Таким чином, визначаються граматичні ознаки розглядуваної словоформи.
В основу методу морфологічного аналізу методом логічного множення призначені становища формальної морфології. Вводиться поняття словникової функції - функції, визначеної на словоформах, і сопоставляющей їм деяку інформацію (послідовність нулів і одиниць).
На попередньому етапі будується таблиця, в якій кожної можливої ??букві змінюваної частини (з урахуванням позиції в цій самій змінюваної частини) ставиться у відповідність вектор нулів і одиниць. Кожна з позицій такого вектора відповідає певній комбінації граматичних ознак. Одиниця означає, що дана буква в даній позиції може відповідати цій комбінації граматичних ознак, нуль - що не може.
На першому етапі цей метод також припускає членування словоформи на основу і змінювану частину. Далі по попередньо створеній таблиці векторів кожній букві змінюваної частини підбирається вектор. Далі над векторами проводиться операція логічного множення. Таким чином визначається можлива (можливі) комбінація (-ії) граматичних ознак.
Морфологічний аналіз без словників [2] проводиться без використання словників лише з використанням таблиці афіксів, списку слів-винятків і списку службових незмінних слів (наприклад, спілок, вигуків, прийменників). Цей спосіб використовується досить рідко.
Також мало виправдано, згідно роботі Чесебіева І.А. [1], представляється морфологічний аналіз зі словником словоформ, що припускає наявність словника, що містить список все можливих словоформ з відповідними їм граматичними ознаками. Крім значного зростання словника виникає ще одна проблема: у разі відсутності словоформи в словнику система не має можливості оперувати цим словом.
. 2 Процедурні методи машинної морфології
При процедурному способі формування словоформ здійснюється за допомогою таблиць афіксів, расклассифицировать за частинами мови. Основними частинами мови для синтезу є іменник, прикметник і дієслово (дієслівні форми). Найбільш складно здійснюється синтез дієслівних форм.
Процедурні методи у порівнянні з декларативними вимагають великих тимчасових витрат на обробку одного слова, але обсяг використовуваних словників дозволяє завантажувати словники цілком в оперативну пам'ять. Крім того, такі словники значно легше створювати, оскільки постійні параметри кожного слова вводяться одноразово, разом з його основою. Істотним недоліком процедурних методів є відсутність універсальності. Іншими словами, існує велика кількість слів, які не можна представити у вигляді суми незмінною основи і афікса. Наприклад, для англійських лексем іменник «man», яке має у множині форму «men», безліч неправильних дієслів і т. Д.
Існує два підходи до вирішення завдання процедурними методами.
Перший підхід передбачає наявність словника основ і словника афіксів. Для слова виконується процедура пошуку в словнику основ. При цьому шукаються всі основи, з яких може починатися аналізоване слово. Якщо чергова основа задовольняє цій умові, то зі словника афіксів витягується рядок, що містить всі можливі афікси для даної основи. Кожен афікс з цього рядка по черзі приєднується до основи, і результат порівнюється з аналізованих словом. У разі їх точного збігу формується чергова запис в список результатів пошуку: за порядковим номером афікса в рядку афіксів визначається змінна МІ (наприклад, для іменника - число і відмінок), а по словникової інформації даної основи - постійна МІ.
Якщо в результаті такого пошуку не знайдено жодного успішного варіанту, то проводиться пошук серед виключень. Винятки присутні в словнику основ поряд зі звичайними основами. І ті, й інші мають в словнику інформацію про постійні морфологічних ознаках і про номер рядка допустимих афіксів.
Різниця між винятками і звичайними основами полягає в тому, що, по-перше, рядок з незмінною частиною слова у винятків порожня, і, по-друге, номер рядка афіксів для винятків відноситься не до файлу афіксів, а до окремого файлу ви...