ся і далі буде відповідати заданому формату. Процес йде аж до кінця абзацу. Застосовувана для введення тексту клавіатура є частиною периферійного оснащення комп'ютерів. p> Сьогодні однією з найбільш часто використовуваних програм введення та обробки тексту є Microsoft Word. З її допомогою тексти, набрані та збережені на носії даних, можуть далі без проблем використовуватися в технологічному процесі. Відомі й інші пакети, наприклад Word Perfect і Macintosh Word. Для набору наукових текстів з формулами і спеціальними знаками особливо підходять програмні продукти TEX. p> Вказівки з оформлення тексту повинні бути обмежені в рукописі характеристиками заголовків, абзаців, порядком розташування ілюстрацій, якщо вони поміщаються в певному місці тексту, а також необхідної розміткою початку нової сторінки (переважніше - правої). p> Автор може передати текст видавництву або друкарні через мережу даних (наприклад, електронною поштою через мережу ISDN). Це економить час і підвищує актуальність інформації. Комунікації служать, головним чином, для спілкування автора і видавництва. Для цього визначаються формати даних, протоколи та інтерфейси взаємодії.
Введення за допомогою оптичних методів (OCR)
За допомогою технології OCR (Optical Character Recognition - оптичне розпізнавання знаків) текст, представлений в рукописній чи машинописної формі, перетворюється в цифрову форму і тим самим стає придатним для обробки. Спочатку в "процесі відображення "документа, що знаходиться на папері, здійснюється його введення оптоелектронними системою зчитування. Документ постає у вигляді бітової карти. Надалі бітова структура знака конвертується в текстовий код [1-2]. p> У процесі зчитування документ сканується і описується певною матричної структурою. Значення яскравості і кольору кожної точки матриці записуються в цифровій формі. Чорно документи при скануванні описуються одним бітом інформації на точку зображення. При скануванні кольорових оригіналів з розкладанням на 4 фарби необхідно використовувати до 32 біт на точку. Дозвіл пристроїв, здійснюють сканування, визначає, наскільки точно лічену зображення відповідає оригіналу. Для більшості текстових оригіналів дозвіл 300 dpi дозволяє отримати високу надійність розпізнавання знаків при використанні процесів OCR (кегль шрифту, починаючи приблизно з 4 мм, в Залежно від чіткості накреслення елементів шрифту). Ілюстрації та текст, набраний шрифтами малих кеглів, вимагають дозволу зчитування 600 dpi. Для цифрового представлення зображення зазвичай використовують формат TIFF (Tagged-Image File Format). Процес OCR охоплює 5 етапів:
ідентифікація текстових і ілюстраційні блоків з виключенням останніх;
розпізнавання знака при допомогою аналізу його форми та порівняння з характерними ознаками еталона; ідентифікація слова за допомогою масивів словників;
коректура нерозпізнаних слів чи знаків шляхом відображення їх на екрані з підтвердженням або виправленн...