ча. Але навіть при недостатньому рівні такого налаштування застосування системи МП дозволяє знизити витрати на переклад на 20% від його вихідної вартості, не кажучи вже про швидкість виконання такого перекладу навіть із залученням перекладачів в ролі редакторів отриманих машинних результатів. p align="justify"> Ясне розуміння того факту, що результат МП є найчастіше первопродуктом, які вимагають подальшого (або попереднього) редагування, дає можливість використовувати практичні системи МП для навчання редагуванню.
Широка практична експлуатація систем МП показала різні можливості таких системи не тільки з точки зору практики перекладу, але і для цілей навчання. Зокрема, редагування результатів МП досить корисно для навчання перекладу, особливо при оволодінні термінологією. p align="justify"> Досвід розробки систем машинного перекладу показав, що завдання створення повністю автоматизованих систем, що забезпечують високоякісний переклад, який не потребує подальшого постредагування, є недосяжним ідеалом. Тому при створенні практичної системи машинного перекладу слід враховувати реальні потреби користувачів систем і можливості моделювання речемислітельной процесу. p align="justify"> Практичні рекомендації по роботі
з системою машинного перекладу
Обробка тексту в системі МП починається з попереднього формального аналізу тексту. Завданням цього рівня автоматичного предредактірованія є попередня розмітка тексту, в процесі якої визначаються межі його окремих розділів (частин, глав, параграфів, абзаців, речень), кордону заголовків, змісту, малюнків, таблиць і формул. Крім того, на цьому рівні особливим чином обробляється і запам'ятовується для відновлення при синтезі перекладу формально графічна структура тексту: фрагменти, виділені особливим шрифтом або малими літерами, фрагменти, розташовані з особливим, відмінним від решти тексту відступом і т. д.
Подібна розмітка є базою для подальшого аналізу тексту і для синтезу тексту, точно повторює структуру початкового.
Результати, одержані на рівні автоматичного предредактірованія, залежать від того, наскільки чітко можна визначити необхідні фрагменти, наскільки коректно їх виділення в тексті.
Основою для подальшого аналізу є текст, розбитий за пропозиціями, тому в будь-якій системі виділяється спеціальний модуль попереднього структурного аналізу, який відповідає за поділ тексту на пропозиції. Для мов з ієрогліфіки або арабським алфавітом цей модуль вимагає реалізації спеціальних процедур розподілу тексту на слова, в інших випадках кордоном слова вважається пробіл. p align="justify"> Розбивка тексту на пропозиції вимагає розробки спеціальних алгоритмів аналізу знаків пунктуації, особливо точки, яка може бути як ознакою кінця пропозиції, так і частиною абревіатури або власної назви. Це завдання вимагає рішення навіть у тому випадку, коли наприкінці пропозиції точка відсутня (як у випадку заголовка). p align="justify"> Заголовки, розділи змісту, підписи до малюнків і назви таблиць повинні в початковому тексті позначатимуться особливим чином, так як найчастіше вони представляють собою називние пропозиції, що вимагають спеціального парсинга: справа в тому, що в цих пропозиціях немає необхідності шукати дієслово-присудок, який в пропозиціях інших типів становить вершину дерева залежностей.
Досвід показує, що при середній довжині пропозиції в10 слів результат МП оптимальний, однак у реальному тексті цей показник дуже часто перевищується. Так, середня довжина пропозиції в газеті становить 22,4 слова, проте дослідження показують, що максимальна довжина пропозиції може досягати 199 слів. Тому однією з функцій користувача, що бажає отримати результат МП, що вимагає мінімального редагування, є перегляд тексту для спрощення структури та зменшення довжини найскладніших фрагментів тексту. Дуже часто таке редагування дозволяє уточнити сенс перекладаються фрагментів, які в технічному тексті також можуть мати дуже велику довжину. Як приклад наведемо пропозиції з автентичних російської та англійської технічних текстів, що мають довжину 73 і 72 слова відповідно. Аналіз та переклад таких пропозицій створює складності навіть у досвідчених перекладачів. p align="justify"> Проте перетворення наддовгих пропозиції з розбивкою на декілька більш коротких речень з меншим числом однорідних членів дозволяє отримати вже редагований машинний переклад.
Аналіз цього прикладу показує, що при збереженні наповнення словника складними термінами незначне спрощення вихідної структури і розбивка російського пропозиції на три досить довгих (відповідно 32, 33 і 8 слів) дозволяє отримати результат машинного перекладу, який зрозумілий спеціалісту і може бути легко відредагований кваліфікованим перекладачем. У цьому прикладі слід звернути увагу на постійно зберігається навіть після редагування інвертова...