ючових слів для подальшого пошуку необхідної інформації (наприклад: система SoftSolutions). Пізніше стала застосовуватися технологія оптичного розпізнавання символів OCR (Optical Character Recognition). Після сканування та введення документа в систему його графічний образ "перекладається" в текст, потім слід виправлення помилок розпізнавання.
При масовому ручному введенні однотипних документів використовуються електронні форми, які забезпечують структуризацію документа шляхом виділення частин тексту і додавання полів (атрибутів), що дозволяє спростити заповнення документів і виконати необхідні обчислення. Інформація в офіс може надходити і шляхом імпорту файлів з магнітних носіїв або з телекомунікацій (факси, повідомлення електронної пошти тощо).
Введення інформації супроводжується класифікацією документів шляхом завдання атрибутів і ключових слів, анотуванням їх змісту. Для прискорення подальшого контекстного пошуку проводиться повнотекстове індексування документів.
Важливе значення для організації ефективного управління неструктурованими документами мають методи зберігання інформації, навігації, пошуку і фільтрації документів.
Документи можуть зберігатися просто у файловій системі, і при цьому система каталогів служить засобом групування і навігації в сховище документів. У сучасних ОС типу Windows 95 є можливість завдання довгих імен каталогів і файлів в як назв папок і документів, а також є відповідні засоби пошуку файлів за їх параметрами.
Ряд систем, заснованих на електронній пошті, зберігають документи в поштових скриньках у вигляді поштових повідомлень з приєднаними файлами. Навігація в сховище спрощується за допомогою вкладених папок особистого і колективного користування. Однак у таких системах пошук і фільтрація обмежені лише відбором і сортуванням документів по атрибутам і тексту поштового повідомлення.
Специфічний метод зберігання реалізований в пакеті Lotus Notes у вигляді так званої бази документів. База документів може зберігати як однотипну так і різнотипних інформацію у вигляді одного файлу. Документи допускають внутрішню структуризацію на основі формулярів шляхом виділення та додавання полів у документі. Навігацію в базі документів спрощує наявність сторінок баз документів і категорій документів. Поштові повідомлення також зберігаються у вигляді бази документів, файли довільного виду допускається приєднувати до текстових документів.
Багато сучасні системи електронних д ОКУМЕНТА використовують на додаток до файлової системі так звані бібліотеки документів, що містять у БД картки документів з атрибутами та ключовими словами. Для логічного угруповання документів застосовуються папки. p> Пошук і фільтрація документів здійснюється за запитами на основі контекстного пошуку: за атрибутами, за ключовими словами і за повним змістом тексту на основі індексу. При використанні механізму чіткого пошуку (наприклад, DOCS OPEN) у запиті не повинно бути орфографічних п...