чіткість дотримання один за одним слабких і сильних складів. Наступні строфи, як правило, будуть раз за разом повторювати одну і ту ж схему. Саме це чергування ритмічних відділів наділяє поетичні тексти мелодійністю, схожою з динамікою музичних композицій.
Однак тут виникає проблема, пов'язана з автоматизацією ритмічного аналізу: слабкі і сильні позиції не завжди збігаються з ненаголошеними і ударними складів відповідно. Тобто, наприклад, у наведеному вище прикладі, слово «сніжні» записано як «/ - /». У слові є дві сильні позиції. Ці позиції залежать безпосередньо від ритмічного контексту. У даному випадку мова йде про так званому акценті. Акцент - це інтонаційна відособленість складу за рахунок підвищення голосового тону, в той час як наголос характеризує склад збільшеною гучністю і мелодійної виділених [13]. Акцент часто збігається з наголосом, але це не дозволяє співвідносити ці два поняття один з одним. Тому за схемою (2) не можна визначити формальну постановку наголосів у словах.
Для подальшої розробки автоматизованого апарату, доведеться відмовитися від класичного літературного розуміння ритмічного малюнка, що грунтується наакцентах, і виробляти його формування на основі наголосів. Таким чином, схема знаходить наступний вигляд:
(3)/-/-/-/-
/-/- - -/
///-/-/-
/-/-/-/
Схема (3) не відповідає базовим вимогам метрики, зате по ній можна побачити, в яких позиціях слід очікувати ударні і ненаголошені позиції. Такий підхід дозволяє наділити процес формування ритмічного малюнка прикладної користю у визначенні наголосів у невідомих словах.
Взявши за основу схему першої строфи, прийняту за зразковий ритмічний малюнок, слід провести почергове порівняння з кожною наступною строфою, виробляючи відповідні корективи зразкового ритмічного малюнка. Зібравши інформацію по всьому вірша, стає можливим виділити найбільш релевантні елементи для формування кінцевого еталонного ритмічного малюнка, який буде максимально відповідати структурі всіх строф. Це дозволить зробити аналіз невідомих слів і сформулювати гіпотезу про їх ритмічній структурі для подальшого оновлення словника наголосів.
3. Розробка технічного завдання
. 1 Призначення і область застосування
Дана система призначена для автоматизації процесу поповнення словників наголосів і орфоепічних словників для подальшого використання в масштабних проектах, що використовують відповідні словники для вирішення виробничих завдань.
. 2 Цілі і особливості розробки системи
Розробляється система призначена для автоматизації поповнення словника наголосів. Система є повністю автоматизованою. Метою створення системи є зменшення трудовитрат на створення і словників наголосів, що припускає лише незначне втручання користувача в роботу системи.
. 3 Опис об'єктів проектування
На вході є базовий словник наголосів, розбитий на текстові документи в залежності від положення ударного складу. На основі ритмічного малюнка завантажуваного віршованого тексту, формулюються гіпотези про розстановку наголосів у тих словах, в яких положення наголоси було невідомо, і здійснюється поповнення словника.
. 4 Вимоги до програми
Розробка, налагодження і тестування здійснюються на мові C # в середовищі програмування Microsoft Visual Studio 2010. Програма має інтуїтивно зрозумілим графічним інтерфейсом і може використовуватися на будь-яких комп'ютерах з встановленою операційною системою Windows.
. 5 Етапи розробки
Дослідження об'єкта проектування.- 28 лютий 2013р.; Розробка методики складання та аналізу ритмічних малюнків.- 10 березень 2013р.; Методика поповнення словника - 20 березня 2013р.; Розробка та налагодження програмного забезпечення - 20 квітень 2013р.; Приклад використання програмного забезпечення - 30 квітень 2013р.; Оформлення дипломного проекту - 20 травня 2013р.
. 6 Порядок здачі
Згідно ГОСТ 19301-79 ЕСПД Порядок і методика випробувань, тестування. Вимоги до змісту та оформлення .
4. Розробка методу
. 1 Токенізація вірша
На початковому етапі необхідно позбутися від знаків пунктуації, для того щоб мати можливість працювати безпосередньо зі словами. Для цього здійснюється токенізація - виділення лексем серед набору символів. У результаті залишаються тільки ті елементи, які безпосередньо вплинуть на подальше формування ритмічного малюнка.