В В В В В В В В В В В В В В
РЕФЕРАТ
На тему
Огляд можливостей мов електронних документів
ВСТУП
Спочатку слово розмітка, як правило, використовувалося для описів анотацій або інших позначень усередині тексту, які призначалися для вказівок упорядника документа або, як його іноді називають, "верстальщику" того, як саме конкретне місце повинно бути надруковано. Подібні способи можуть включати в себе підкреслення хвилястою рисою, що позначає курсив, якісь спеціальні значки для пропуску окремих фраз або їх друку конкретним шрифтом, і так далі. Коли з часом форматування та друк стали автоматизованими, цей термін вже охоплював всі види спеціальних кодів розмітки, які вставлялися в електронні текстові документи для управління форматуванням, печаткою або інший обробкою. p> Під мовою розмітки, таким чином, розуміють набір угод про принципи форматування, які застосовуються для кодування текстових блоків. Мова розмітки повинен чітко позначати, яка розмітка припустима саме в даному документі, яка розмітка обов'язкове, як відрізнити її елементи від простого тексту і що розмітка означає. <В
МОЖЛИВОСТІ SGML
SGML (Standard Generalized Markup Language) був офіційно прийнятий в 1986 році в якості міжнародного стандарту (ISO 8879:1986) для опису незалежних від пристроїв введення/виводу і від обчислювальної середовища методів представлення текстової інформації в електронній формі. Основою для його створення послужив досить старий мова розмітки GML (Generalized Markup Language), розроблений компанією IBM ще в часи перших персональних копьютеров. Якщо бути точним, то SGML - це метамова, призначений для опису інших мов розмітки. p> Можливості SGML : p>
1. Мета появи SGML дуже проста. У той час існувало декілька "мов розмітки", ні один з яких не був сумісний з декількома платформами або навіть програмними пакетами. Поява SGML зробило можливим уніфікацію мов розмітки , що було використано для забезпечення гнучкості і можливості передачі інформації між додатками і платформами. p> 2. SGML, на відміну від всіх інших мов розмітки, створених на його основі, використовує принцип так званої описової розмітки замість процедурної. Подібна система використовує елементи розмітки, які попросту надають назви для віднесення окремих частин документа до певних категорій. Іншими словами, теги, такі як або end {list}, просто ідентифікують порцію документа і стверджують, що "ця частина є параграфом" або що "ця частина є кінцем початого списку", і т.п. Система ж, що використовує процедурну розмітку (сюди потрапляють текстові процесори, наприклад, Microsoft Word) визначає, яка безпосередньо обробка буде виконуватися в конкретній точці текстового документа: "в цьому місці викликати таку-то процедуру з параметрами 5, е і z "або" пересунути кордон документа на 7 мм правіше щодо якого елемента, пропустити одну рядок розпочати наступну з нового рядка "і т.д. У SGML інструкції, які необхідні для обробки документа з певною конкретною метою (Наприклад, для форматування), чітко відокремлюються від описової розмітки, яка зустрічається усередині документа. Зазвичай вони зібрані за межами документа у окремих процедурах або програмах. p> При використанні описової, а не процедурної розмітки один і той же документ може бути оброблений різними програмами, кожна з яких може застосовувати свої власні інструкції обробки до тих його частинам, які вона вважає важливими. Наприклад, програма аналізу вмісту може повністю ігнорувати виноски, тоді як програма форматування може витягувати і збирати їх для друку в Наприкінці кожної частини. Різні види інструкцій обробки можуть асоціюватися з однієї і тієї ж частиною файлу. Наприклад, одна програма може витягати з документа прізвища людей і географічні назви для створення індексу або бази даних, тоді як інша, обробна той самий текст, може друкувати прізвища і назви відрізняється шрифтом. p> 3. SGML вводить також поняття типу документа, і, відповідно, способи його визначення (Document type definition, DTD). Документи вважаються типізований, так само як і інші оброблювані комп'ютерами об'єкти. Тип документа формально визначається його складовими частинами та їх структурою. Скажімо, можна визначити тип документа таким чином, що він повинен складатися з заголовка і, можливо, імені автора, за якими слід анотація і послідовність одного або більш абзаців. Будь-який документ у відсутність заголовка, відповідно з цим формальним визначенням, нічого очікувати бути звітом, так само, як не буде їм бути і послідовність абзаців, за якою слідує анотація, незважаючи на те, наскільки схожий на звіт такий документ з точки зору читача-людини. p> Оскільки документи відносяться до відомих типів, можна використовувати спеціальну програму, звану аналізатором (parser), для того щоб обробити документ, стверджує, що він відноситься до кон...