бо 0.
Для вирішення поставленого завдання були адаптовані функції швидкого пошуку та ефективного зберігання строкових величин цього модуля для слів англійської мови, тому зупинимося на описі бібліотеки РДМА_ІПІІ більш докладно. У комплект її поставки входять наступні файли: .h- заголовний файл із описом експортованих функцій і використовуваних типів;
UkrDeclareLemma.dll, UkrDeclareLemma.lib - файли бібліотеки;
tab.dat, tree.dat, connect.dat - файли, що містять дані словникової бази.
Інтерфейс бібліотеки дозволяє виконувати дії за наступними напрямками:
очистка, завантаження і збереження словникової бази;
модифікація словникової бази;
отримання інформації про словоформах;
отримання інформації про словниковій базі;
службові функції.
2. Обгрунтування вибору програмних і технічних засобів реалізації
. 1 Вибір мови програмування
Вибір мови програмування визначає різноманітність можливостей, які програміст може реалізувати в додатку, а також те, наскільки швидко він це зробить.
Сі ++ (англ. C ++) - компільований строго типізований мова програмування загального призначення. Підтримує різні парадигми програмування: процедурну, узагальнену, функціональну; найбільшу увагу приділено підтримці об'єктно-орієнтованого програмування (ООП).
Концепція ООП вносить в арсенал розробника новий засіб - класи. Класи поряд з об'єктами складають наріжний камінь багатьох сучасних мов високого рівня. Під класом розуміється якась сутність, яка задає деяке загальне поведінка для об'єктів. Таким чином, будь-який об'єкт може належати або належати певного класу, тобто володіти або з мати поведінкою, яка даний клас увазі. Крім цього ООП дає підхід до наступних важливих властивостям класів.
Абстракція даних lt; # 320 src= doc_zip1.jpg / gt;
Малюнок 3.1 - Функціональна схема взаємодії модулів системи синтезу парадигм слів англійської мови
Пояснення до малюнка 3.1._lem.txt - файл у форматі txt, що містить початкові форми слів і граматичну інформацію у вигляді послідовності символів, необхідну для породження парадигм (створюється користувачем); _ par.dat - файл, створений консольним додатком і містить парадигми лем з файлу Engl_lem.txt з МІ кожної словофоми; - строкова величина, лема, введена користувачем, для якої необхідно отримати парадигму; _F - строкова величина, словоформа, що входить в парадигму Lemma; - бітове число, що задає МІ словоформи W_F; - логічна змінна, що приймає значення 1, якщо W_F є леммой, 0 - інакше; - парадигма слова Lemma у вигляді списку словоформ з МІ для кожної словоформи.
Для забезпечення необхідних функціональних можливостей була розроблена архітектура системи синтезу парадигм слів англійської мови, що містить 3 взаємопов'язаних модуля.
Консольне додаток необхідно для забезпечення роботи системи в режимі наповнення словникової бази. Воно відповідає за завантаження файлу «Engl_lem» у форматі txt зі словником початкових форм англійських слів, а також за алгоритмами словозміни генерує парадигми всіх лем зі словника зі збереженням результату в текстовий файл «Engl_par». При цьому кожній словоформе приписується її МІ, користувач може редагувати обидва файли, не порушуючи формат вхідних і вихідних даних.
Отриманий в результаті роботи консольного застосування файл з парадигмами в режимі наповнення надходить на вхід додатки TABLE, яке призначене для приведення цього файлу у формат, необхідний бібліотекою РДМА_ІПІІ. З додатку TABLE в режимі наповнення викликаються функції бібліотеки РДМА_ІПІІ, що забезпечують очищення, завантаження і збереження словникової бази, а також і її модифікацію (додавання/видалення словоформи).
У результаті наповнення бази словоформ за допомогою бібліотеки РДМА_ІПІІ формуються файли tab.dat, tree.dat, connect.dat, що містять дані словникової бази. У базі даних словоформ, побудованої таким чином, в режимі пошуку парадигми по лемі, введеної користувачем в полі введення додатки TABLE, шукається її парадигма і виводиться користувачеві у вигляді списку словоформ з їх МІ в спеціальне поле.
. 2 Формат вхідних і вихідних даних
Вхідними даними для функціонування розробленого програмного забезпечення автоматичної генерації англійських словоформ є словник початкових форм, що завантажується з текстового файлу «Engl_lem.txt», в якому на цей момент міститься більше 8000 записів. Для його створення використовувався словник синонімів англійської мови The Oxford Thesauru...