Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Новые рефераты » Комп'ютерний аналіз тексту

Реферат Комп'ютерний аналіз тексту





су. Більш повільний пошук, але дозволяє шукати збіги в текстах статей.

4. Сканування виділеного. При виділенні слова і, в залежності від налаштувань, при натисканні клавіш його переклад відображається в спливаючому вікні.

5. Управління словниками. Вимкнення непотрібних словників, а також установка порядок їх використання при запиті.

6. Пошук в інтернеті для різних он-лайн словників.

7. Вимова слів. За наявності звукових записів словник може виконувати вимову слів. p> 8. Переклад повних текстів, використовуючи інтернет-сервіси.

1. 2. Орфокорректори (або спеллчекер) :

А) MS Word - Microsoft Word (часто - MS Word, WinWord або просто Word) - це текстовий процесор, призначений для створення, перегляду і редагування текстових документів, з локальним застосуванням найпростіших форм таблично-матричних алгоритмів. Текстовий процесор, випускається корпорацією Microsoft у складі пакету Microsoft Office. Перша версія була написана Річардом Броді (Richard Brodie) для IBM PC, що використовують DOS, в 1983 році. Пізніше випускалися версії для Apple Macintosh (1984), SCO UNIX і Microsoft Windows (1989). p> Б) aspell - GNU Aspell (або просто Aspell) - вільна програма для перевірки орфографії, розроблена для заміни Ispell. Це стандартна програма перевірки орфографії для системи GNU. Вона також компілюється під інші Unix-подібні операційні системи і Microsoft Windows. Основна програма ліцензується на умовах GNU LGPL, а документація - на умовах GNU FDL. Словники для неї доступні приблизно на 70 мовах. Основний розробник - Кевін Аткінсон (Kevin Atkinson).

1. 3. Системи автоматизованого перекладу, в т.ч. програми управління пам'яттю перекладів :

А) OmegaT - система автоматизованого перекладу, підтримуюча пам'ять перекладів, написана мовою Java. Можливості продукту включають сегментацію вихідного тексту на основі регулярних виразів, використання точних (англ. exact ) і неточних (англ. fuzzy ) відповідностей з уже переведеними фрагментами, використання словників, пошук контекстів в базах даних перекладів і роботу з ключовими словами.

Починаючи з версії 2.04 OmegaT також може перекладати поточний абзац тексту через Google Translate.

Для роботи OmegaT потрібна версія Java 1.4, яка доступна для ОС GNU/Linux, Mac OS X і Microsoft Windows, Windows NT. Може працювати з OpenJDK. p> OmegaT підтримує різноманітні формати вихідних документів: текстові файли (включаючи Unicode), файли HTML/XHTML, StarOffice, OpenOffice.org і OpenDocument (ODF), а також файли DocBook, MediaWiki, Microsoft OOXML, файли. Po (portable object) для бібліотеки інтернаціоналізації gettext, XLIFF і текстові файли зі структурою "Ключ = Значення". З файлами старих пропрієтарних форматів Microsoft Office (Word, Excel і PowerPoint) OmegaT не може працювати безпосередньо, їх необхідно перевести в формат OpenDocument (наприклад, за допомогою OpenOffice.org) або OOXML за допомогою Microsoft Office 2007. p> Б) Trados - система автоматизованого перекладу, спочатку (з 1992 року) розроблена німецькою компанією Trados GmbH. Є одним зі світових лідерів у класі систем Translation Memory (TM, Пам'ять перекладів). p> Система Trados складається з модулів, призначених для перекладу текстів різного формату: документів Microsoft Word, презентацій PowerPoint, текстів у форматі HTML і інших метаданих, документів FrameMaker, InterLeaf та ін, а також для ведення термінологічних баз даних (модуль MultiTerm). Остання версія системи, випущена незалежною компанією Trados - 7.0. Остання версія Trados на сьогоднішній день - SDL Trados Studio 2009. p> Принцип роботи. Концепція Translation Memory припускає виявлення в перекладному тексті фрагментів, переклади яких вже є в базі даних перекладів, і за рахунок цього скорочення обсягу роботи перекладача. Фрагменти, що залишилися не перекладеним, передаються далі для ручної обробки перекладачеві або системі машинного перекладу (Machine Translation, MT). Перекладач на цьому етапі може виділити знову перекладені фрагменти і занести нові пари паралельних текстів на двох мовах в базу даних. Така схема найкращим чином працює у випадку однотипних текстів, де повторюваність словосполучень досить висока, тобто в разі різного роду інструкцій для користувачів, технічних описів.

2) Системи розпізнавання символів OCR :

А) Finereader - система оптичного розпізнавання символів розроблена російською компанією ABBYY.

Можливості. Підтримує розпізнавання тексту на 186 мовах і має вбудовану перевірку орфографії для 38 з них. За деякими даними, після деякого навчання системи вона може почати розпізнавати рукописний текст, але його потрібно буде вчити під почерк користувача.

Б) CuneiForm - вільно розповсюджувана відкрита система оптичного розпізнавання текстів російської компанії Cognitive Technologies. p> Спочатку си...


Назад | сторінка 8 з 9 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Текстова операційна система Microsoft Word. Microsoft Excel
  • Реферат на тему: Методи роботи з Текстовий процесор Microsoft Word
  • Реферат на тему: Текстовий редактор Microsoft Word і табличний процесор Excel
  • Реферат на тему: Текстовий процесор Microsoft Word
  • Реферат на тему: Основи роботи з операційною системою Windows XP. Операції з файловою струк ...