документа протягом їх повного життєвого циклу.
2. Відсутність в системі внутрішніх обмежень на масштаби документальної середовища та кількості одночасно користуються нею.
. Взаємодія зі сформованими інформаційними транспортними середовищами та технічними засобами.
. Організація та підтримка регламентованого доступу як до документальних середах (архівів) в цілому, так і до окремих документів або їх частин.
. Використання засобів машинного зору (сканування і оптичне розпізнавання) для перекладу традиційних паперових документів в електронну форму. Для роботи з історичними архівами повинна використовуватися спеціальна техніка, що виключає пошкодження раритетів.
. Використання електронних засобів навігації (повнотекстовий пошук, авто-реферування, авто-рубріцірованіе, формування словників предметних областей-тезаурусів, формування на базі готових тезаурусів засобів пошуку за поняттями).
. Використання як засоби зберігання описів профілів організацій, їх користувачів та реєстраційних карт документів стандартних індустріальних систем керування базами даних (СКБД -Oracle, MS SQL, DB2, Adabas).
. Забезпечувати незалежність від системно-технічної платформи.
. При створенні документальних систем повинні використовуватися стандартні індустріальні засоби і мови розробки, доступні для власника системи.
. В окремих випадках державному або корпоративному власнику системи повинні бути доступні вихідні коди системи для гарантованого забезпечення її функціонування.
. Графічні інтерфейси користувача повинні бути дружні, інтуїтивно зрозумілі, виконані в стилі, відповідному оточенню (ОС).
. Система повинна бути проста у використанні. Навчання користуванню не повинно займати більше одного робочого дня.
. Система повинна бути налаштованим додатком, а не набором інструментальних засобів.
. Всі служби системи повинні бути виконані на мові країни використання з урахуванням його морфологічних особливостей.
. Забезпечувати розподілене управління, як всієї документальної середовищем, так і її компонентами.
Збільшення інформаційних потоків в науці, виробництві, культурі вимагає адекватної реакції з боку інформаційних технологій. Для суспільства обтяжливо витрачання величезної кількості паперу, та й інформація, що надходить на таких носіях, менш динамічна, ніж електронна.
Важливе значення для організації ефективного управління неструктурованими документами мають методи зберігання інформації, навігації, пошуку і фільтрації документів.
Документи можуть зберігатися просто у файловій системі, і при цьому система каталогів служить засобом групування і навігації в сховище документів. У сучасних ОС є можливість завдання довгих імен каталогів і файлів як назви папок і документів, а також є відповідні засоби пошуку файлів по їх параметрами.
Ряд систем, заснованих на електронній пошті, зберігають документи в поштових скриньках у вигляді поштових повідомлень з приєднаними файлами. Навігація в сховище спрощується за допомогою вкладених папок особистого і колективного користування. Однак у таких системах пошук і фільтрація обмежені лише відбором і сортуванням документів по атрибутах і тексту поштового повідомлення.
Багато сучасні системи електронних документів використовують на додаток до файлової системи так звані бібліотеки документів, що містять у БД картки документів з атрибутами та ключовими словами. Для логічної угруповання документів застосовуються папки.
Пошук і фільтрація документів здійснюється за запитами на основі контекстного пошуку [2]: по атрибутах, за ключовими словами і по повному змісту тексту на основі індексу. При використанні механізму чіткого пошуку (наприклад, DOCS OPEN) у запиті не повинно бути орфографічних помилок, а в тексті документа - помилок розпізнавання. При цьому може морфологічний розбір дозволяє спростити.
На основі нейронних мереж і штучного інтелекту була реалізована технологія нечіткого пошуку за повним змістом документа. Нечіткий пошук не вимагає повної відповідності шуканих фраз з вмістом документів, крім того, виключає потребу у виправленні помилок після розпізнавання тексту. Система пошуку завжди видає користувачеві відповідь, найкращим чином узгоджений з термінами або фразами запиту.
Фірми-виробники реляційних СУБД (зокрема ORACLE) проповідують інші схеми зберігання - текстові та універсальні БД. Тексти документів зберігаються в символьних полях змінної довжини, розширені засоби SQL-пошуку дозволяють формувати змішані з...