Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Статьи » Метод автоматизованого поповнення словника наголосів

Реферат Метод автоматизованого поповнення словника наголосів





задача досить актуальна: в російській мові немає формальних правил постановки наголосу, на відміну від таких мов, як польська, угорська та ін. Розташування наголосів грає важливу роль у віршуванні.

Поезія - форма літературної творчості, в якій твори створюються за допомогою ритмічного розподілу ударних і ненаголошених складів і римуються слів. Поезія завжди відігравала ключову роль у духовному розвитку суспільства. У порівнянні з прозою, вірш є дещо складнішу художню структуру. Прозовий текст підпорядковується лише зовсім невеликій кількості літературних норм, які дозволяють розглядати твір як творчість, що володіє художньою цінністю, у той час як правила, за якими організована поезія, більш жорсткі. За своєю концепцією віршування більше нагадує створення музичної композиції.

Ключовою особливістю поетичних творів є якась ритмічна організованість, завдяки якій в процесі читання вірша людина неусвідомлено будує припущення про те, яка буде інтонація в наступних рядках. Цей факт дозволяє розглядати вірш як чітко структуровану систему з закономірним розташуванням ударних складів.

Якщо проаналізувати ритмічний малюнок вірша з технічного боку, надається можливість висунути гіпотези про те, які будуть ударні позиції у невідомих слів, так як ритм, як правило, зберігається протягом усього твору. Найбільш імовірнісний результат можна сформулювати як еталонний і застосувати для всіх строф. При достатньому обсязі вхідних даних, еталонний ритмічний малюнок дозволить розставити наголоси в тих позиціях строф, де зустрічаються невідомі слова. Іншими словами, якщо вся строфа або деякі її елементи регулярно повторюються в наступних частинах вірші, можна припустити, що така будова буде властива всьому вірша. Це судження дає основу для того, щоб автоматизувати процес поповнення словників наголосів і орфоепічних словників.

У даній роботі наведено детальний опис розробки такої системи і результати її роботи.


1. Призначення і область застосування


Автоматизована методика поповнення словників наголосів, описана в цій роботі, може бути впроваджена в більші системи, що використовують такі словники для вирішення конкретних завдань.


. 1 Синтез мови


Синтезатор мови - це система перетворення тексту в мову. Перші системи синтезу мови почали з'являтися вже на початку XX століття. Все частіше ми можемо спостерігати повсюдне використання таких систем, покликаних автоматизувати видачу конкретної інформації:

· відтворення електронних книг;

· відтворення інформації в інформаційно-довідкових системах для допомоги сліпим і німим;

· оголошення відправлення поїздів і авіарейсів;

· видача інформації про які-небудь технологічних процесах на виробництві.

Синтезатори мови все ще далекі від досконалості: потрібен великий обсяг пам'яті для зберігання знань про те, як відтворювати текст; часто спостерігається порушення інтонації в занадто довгих реченнях; голос синтезатора, як правило, більше нагадує мова робота, ніж мова живої людини. Інженери поступово вирішують кожну з цих проблем, покращуючи якість таких систем.

Методи синтезу людської мови засновані на використанні двох моделей [11]:

1. Модель компілятивного синтезу;

2. Формантного-голосова модель.

Модель компілятивного синтезу являє собою синтез мови шляхом комбінування записаних зразків окремих звуків. При використанні такої моделі складається база даних звукових фрагментів, з яких по шматочках збираються цілі пропозиції. Модель компілятивного синтезу застосовна тільки в найпростіших випадках, коли синтезатор повинен уміти вимовляти досить невеликий і заздалегідь відомий набір фраз. Якість мови при такому підході залишається на досить високому рівні. Тим не менш, на стику складаються звукових фрагментів можливі інтонаційні спотворення і розриви, помітні на слух. Крім того, створення великої бази даних звукових фрагментів, що враховує всі особливості вимови фонем і аллофонов з різними інтонаціями, являє собою складну і копітку роботу.

формантного-голосова модель заснована на моделюванні мовного тракту людини. Така модель може бути реалізована із застосуванням нейронних мереж і допускає самонавчання. Через високої складності точного моделювання особливостей мовного тракту формантного-голосова модель володіє відносно низькою точністю синтезованих звуків мови.

Рішення завдання розстановки наголосів допоможе системам, що працюють зі свідомо невідомим текстом, відтворювати мова більш природно. Для визначення наголоси можна використовувати заготовлений словни...


Назад | сторінка 2 з 22 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Розробка програмного забезпечення системи синтезу парадигм слів англійської ...
  • Реферат на тему: Семантичні мережі. Системи аналізу тексту і синтезу мови
  • Реферат на тему: Модель індукції синтезу IgE
  • Реферат на тему: Імітаційна модель на мові GPSS / H системи поповнення цехового складу детал ...
  • Реферат на тему: Використання моделей життєвого циклу інформаційної системи. Каскадна модел ...