Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Новые рефераты » Робота архіваторів

Реферат Робота архіваторів





Архіватори - це програми для створення архівів. Архіви призначені для зберігання даних в зручному компактному вигляді. В якості даних звичайно виступають файли і папки. Як правило, дані попередньо піддаються процедурі стиснення або упаковки. Тому майже кожен архіватор одночасно є програмою для стиснення даних. З іншого боку, будь-яка програма для стиснення даних може розглядатися як архіватор. Ефективність стиснення є найважливішою характеристикою архіваторів. Від неї залежить розмір створюваних архівів. Чим менше архів, тим менше місця потрібно для його зберігання. Для передачі потрібна менша пропускна здатність каналу передачі або затрачається менший час. Переваги архівів очевидні, якщо врахувати, що дані зменшуються в розмірі та в 2 рази, і в 5 разів.

Стиснення даних використовується дуже широко. Можна сказати, майже скрізь. Наприклад, документи PDF, як правило, містять стислу інформацію. Досить багато виконуваних файлів EXE стиснуті спеціальними пакувальниками. Всілякі мультимедійні файли (GIF, JPG, MP3, MPG) є своєрідними архівами. p> Основним недоліком архівів є неможливість прямого доступу до даних. Їх спочатку необхідно витягти з архіву або розпакувати. Операція розпакування, втім, як і упаковки, вимагає деяких системних ресурсів. Це не миттєва операція. Тому архіви в основному застосовують з порівняно рідко використовуваними даними. Наприклад, для зберігання резервних копій або інсталяційних файлів.

В даний момент існує багато архіваторів. Вони мають різну поширеність і ефективність. Деякі цікаві архіватори не відомі широкому колу потенційних користувачів. Особливий інтерес представляють оцінка та порівняння ефективності стиснення популярних архіваторів.


Методи стиснення

Розроблено велику кількість різноманітних методів, їх модифікацій і підвидів для стиснення даних. Сучасні архіватори, як правило, одночасно використовують кілька методів одночасно. Можна виділити деякі основні. p> Кодування довжин серій (RLE - скорочення від run-length encoding - кодування довжин серій)

Дуже простий метод. Послідовна серія однакових елементів даних замінюється на два символи: елемент і число його повторень. Широко використовується як додатковий, так і проміжний метод. В якості самостійного методу застосовується, наприклад, в графічному форматі BMP.

Словниковий метод (LZ - скорочення від Lempel Ziv - імена авторів)

Найбільш поширений метод. Використовується словник, що складається з послідовностей даних або слів. При стисненні ці слова заміняються на їх коди зі словника. У найбільш поширеному варіанті реалізації в якості словника виступає сам вихідний блок даних.

Основним параметром словникового методу є розмір словника. Чим більше словник, тим більше ефективність. Однак для неоднорідних даних надмірно великий розмір може бути шкідливий, тому що при різкій зміні типу даних словник буде заповнений неактуальними словами. Для ефективної роботи даного методу при стисненні потрібна додаткова пам'ять. Приблизно на порядок більше, ніж потрібно для вихідних даних словника. Істотним перевагою словникового методу є проста і швидка процедура розпакування. Додаткова пам'ять при цьому не вимагається. Така особливість особливо важлива, якщо необхідний оперативний доступ до даних.

Ентропійний метод (Huffman - кодування Хаффмена, Arithmetic coding - арифметичне кодування).

У цьому методі елементи даних, які зустрічаються частіше, кодуються при стисненні більш коротким кодом, а більш рідкісні елементи даних кодуються більш довгим кодом. За рахунок того, що коротких кодів значно більше, загальний розмір виходить менше вихідного.

Широко використовується як додатковий метод. В якості самостійного методу застосовується, наприклад, в графічному форматі JPG.

Метод контекстного моделювання (CM - скорочення від context modeling - контекстне моделювання)

У цьому методі будується модель вихідних даних. При стисненні чергового елемента даних ця модель видає своє пророкування або ймовірність. Згідно цієї ймовірності, елемент даних кодується ентропійним методом. Чим точніше модель буде відповідати вихідними даними, тим точніше вона буде видавати пророкування, і тим коротше будуть кодуватися елементи даних.

Для побудови ефективної моделі потрібно багато пам'яті. При розпакуванні доводиться будувати точно таку ж модель. Тому швидкість і вимоги до обсягу оперативної пам'яті для упаковки і розпакування майже однакові. В даний момент методи контекстного моделювання дозволяють отримати найкращу ступінь стиснення, але відрізняються надзвичайно низькою швидкістю.

PPM (PPM - Prediction by Partial Matching - пророкування щодо часткового збігу)

Це особливий підвид контекстного моделювання. Передбачення виконується на підставі певної кількості попередніх елеме...


сторінка 1 з 5 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Стиснення даних
  • Реферат на тему: Архівація і стиснення даних
  • Реферат на тему: Алгоритми стиснення даних
  • Реферат на тему: Розробка бази даних для зберігання інформації даних характеристик товару
  • Реферат на тему: Ієрархічна модель даних. Структури даних