Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Новые рефераты » Корпоративні системи управління

Реферат Корпоративні системи управління





DMS використовується технологія оптичного розпізнавання символів (OCR - Optical Character Recognition). Після сканування та введення документа в систему відбувається переклад графічного образу документа в текстовий файл, після чого слід досить трудомісткий процес виправлення помилок у тексті, допущених при розпізнаванні. Необхідна інформація шукається за допомогою механізму чіткого пошуку за повним змістом документа. Прикладами систем, що використовують описану технологію, можуть служити ZyIMAGE (ZyLAB Division of IDI), Topic (Verity), BRS/Search (Dataware). p> Які найбільш серйозні обмеження пропонованих систем:

В· Використання технології ключових слів "коштує" від $ 5 до $ 20 на документ.

В· Визначення ключових слів - досить суб'єктивний процес, а також ключові слова зі часом втрачають свою значимість.

В· При використанні технології OCR потрібно витрачати значні зусилля на "Очистку" тексту після використання коштів OCR, тому що навіть самі досконалі засоби розпізнавання не дають 100% точність. Це дуже трудомісткий і дорогий процес, його вартість складає від $ 1 до $ 10 на сторінку.

В· Під всіх пропонованих системах EDMS використовується механізм чіткого пошуку, тому якщо в запиті допущені орфографічні помилки або в тексті документа не виправлені помилки розпізнавання, система ніколи не знайде потрібної інформації.

В· Індекс систем з полноконтекстним пошуком становить від 200% до 400% від обсягу вихідних документів, що висуває серйозні вимоги до ресурсів комп'ютера і істотно збільшує час пошуку при збільшенні потоку документів.

На початку 90-х років на ринку систем EDMS з'явилися нові розробки з використанням новітніх технологій нейронних мереж і штучного інтелекту. У системах третього покоління, створених на основі цих технологій, реалізований нечіткий пошук по повним змістом документа і дуже "компактне" індексування (Всього лише 30% від обсягу вихідного тексту). p> Нечіткий пошук означає індиферентність стосовно до помилок як у вхідних даних, так і в формулюваннях запиту, тобто він скорочує до мінімуму вплив помилок розпізнавання символів, помилок набору на клавіатурі при введенні даних, а також помилок правопису в запитах пошуку. За допомогою механізму нечіткого пошуку ви можете знайти те, що шукаєте, навіть якщо ви не знаєте, як це пишеться, забули, як це називається або якщо це виявиться неправильно зареєстровано. Система завжди видає користувачеві відповідь, найкращим чином узгоджений з термінами або фразами запиту, за яким проводиться пошук.

На ринку комерційні системи EDMS третього покоління представлені програмним продуктом Excalibur EFS (Excalibur Technologies Corp.). Пакет Excalibur EFS базується на технології адаптивного розпізнавання образів APRP (Adaptive Pattern Recognition Processing), розробленої компанією Excalibur Technologies і реалізованої в пакеті з використанням механізму нейронних мереж.

Технологія APRP забезпечує автоматичну інд...


Назад | сторінка 8 з 18 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Розпізнавання мелодії за допомогою нечіткого пошуку
  • Реферат на тему: Розпізнавання режимів роботи авіаційного ГТД з використанням технології ней ...
  • Реферат на тему: Розпізнавання ключових слів у потоці мовлення за допомогою фонетичного стен ...
  • Реферат на тему: Історія систем розпізнавання образів
  • Реферат на тему: Ознаки символів, використовувані для автоматичного розпізнавання