Реферат Використання інформаційних технологій в ономастичних дослідженнях

Тема: Новые рефераты

овами, для розпізнавання тексту потрібно моделювання міркувань людини в подібній ситуації, а це прийнято позначати терміном «штучний інтелект».

Основою роботи FineReader є так званий пакет, що містить всю інформацію про розпізнається документі. Пакет являє собою набір сторінок документа і може містити близько тисячі сторінок.

Користувач імпортує в пакет зображення сторінок зі сканера або безпосередньо з файлів графічних форматів.

Наступний крок - аналіз макета сторінок пакета, тобто виділення областей, що підлягають розпізнаванню. На цьому етапі FineReader аналізує орієнтацію сторінки, а також виділяє блоки - області, які при подальшому аналізі будуть інтерпретуватися як текст, таблиці або малюнки.

Після аналізу макета сторінок проводиться власне розпізнавання тексту і таблиць. Далі проводиться перевірка правопису, після чого «на суд» користувача виносяться слова, яких немає в словнику системи, а також символи, в точності розпізнавання яких програма не впевнена.

Завершальний етап роботи програми - збереження та експорт результатів розпізнавання. Насправді, користувач не має необхідності спеціально зберігати документ, якщо тільки він не збирається імпортувати його в інші формати для подальшої роботи, так програма автоматично зберігає виконану роботу.

Перш ніж FineReader приступить до власне розпізнаванню тексту, він повинен «знати», які саме області підлягають розпізнаванню, як розташовані рядки.

Визначення орієнтації тексту при встановленні відповідної опції проводиться автоматично, хоча можна зробити це і вручну. Отже, натискаємо кнопку Розпізнати, причому різні частини нашого зображення, що містять текст, таблиці або малюнки, виявилися обведені рамками різних кольорів і позначені цифрами в кутку кожної рамки. Це так звані блоки, які виділяються для того, щоб вказати програмі, які ділянки сторінки і в якому порядку треба розпізнавати [14, с. 233].

Після створення макета і його редагування можна приступити до розпізнавання. Завдання розпізнавання полягає в тому, щоб перетворити відскановане зображення у текст, зберігши при цьому оформлення сторінки. Перше, чому слід приділити увагу, - це вибір мови тексту, що розпізнається.

Також при необхідності можна вибрати вручну тип друку і відкоригувати якість розпізнавання. Весь розпізнаний текст видно у вікні тексту головного вікна програми. Воно являє собою нескладний текстовий редактор, що дозволяє вільно змінювати і гарнітуру шрифту, і його накреслення.

Після закінчення перевірки правопису слід визначити, в якому форматі зберігати отримані результати (кнопкаЗберегти), наприклад RTF, DOC, PDF, HTML, DBF, XLS.

Дана програма дозволяє передавати результати практично в усі широко використовувані програми, такі як MS Word, MS Excel, а також використовувати автоматичне введення для публікації в Web і для заповнення баз даних.

2.2 Системи розпізнавання мови

Розпізнавання мови (speech recognition), також відоме як автоматичне розпізнавання мови (automatic speech recognition), STT (speech-to-text), комп'ютерне розпізнавання мови (computer speech recognition), - процес перетворення мовного сигналу в послідовність слів за допомогою деякого алго...

Назад | сторінка 5 з 10 | Наступна сторінка

Схожі реферати:

Реферат на тему: Розробка алгоритму роботи синтаксичного аналізатора тексту, а також бази да ...

Реферат на тему: Сучасні технології розпізнавання мови

Реферат на тему: Досвід розробки моделі розпізнавання російської мови з надвеликим словником

Реферат на тему: Алгоритм і програма розпізнавання образів

Реферат на тему: Розробка програми розпізнавання зорових образів

Український реферат переглянуто разів: | Коментарів до українського реферату:

Коментарів до українського реферату: 0