Pкрасн. =20/100=0,2
Pсін. =30/100=0,3
Pзел. =40/100=0,4
I=- (0,1? log20,1 + 0,2? log20,2 + 0,3? log20,3 + 0,4? log20,4)? 1,85 біта
Відповідь: 1,85 біта
.Студенти групи вивчають одну із трьох мов: англійська, німецька або французька. Причому 12 студентів не вчать англійську. Повідомлення, що випадково обраний студент Петров вивчає англійську, несе log23 біт інформації, а що Іванов вивчає французьку - 1 біт. Скільки студентів вивчають німецьку мову?
Дано:
Y - вчать французький
X - вчать англійську, 12 не вчать англійську. Всього 12 + X студентів
N=12 + X
K1=X
i1=log23 біт
i2=1 біт
Рішення:
(12 + X)/X=2log23
+ X=3X
X=6=12 + 6=18
K2=Y
18/Y=21
Y=9
-XY=18-6-9=3 студента вивчають німецьку.
Відповідь: 3
Алфавітний підхід до вимірювання інформації
Якщо інформація представлена ??у вигляді дискретного повідомлення, то логічно вважати кількістю інформації його довжину, тобто загальне число знаків у повідомленні. Але довжина повідомлення залежить не тільки від міститься в ньому інформації. На неї впливає потужність алфавіту використовуваної мови. Чим менше знаків у використовуваному алфавіті, тим довше повідомлення. Так, наприклад, в алфавіті азбуки Морзе всього три знаки (крапка, тире, пауза), тому для кодування кожній російській або латинської літери потрібно використовувати декілька знаків, і текст, закодований по Морзе, буде набагато довший, ніж при звичайній запису.
Приклад: Сигнал SOS: 3 знака в латинському алфавіті;
знаків в алфавіті Морзе: пауза - - - пауза.
Для упорядкування вимірювань інформаційний обсяг повідомлень прийнято вимірювати в бітах. Один біт відповідає одному знаку довічного алфавіту. Отже, щоб виміряти довжину повідомлення, його потрібно представити в двійковому вигляді і підрахувати кількість двійкових знаків - бітів. При цьому зовсім не обов'язково вміти інтерпретувати повідомлення.
Приклад. Нехай повідомлення в двійковому алфавіті виглядає наступним чином: 000100010001. Ми не знаємо, яка інформація була закладена в цьому повідомленні, але можемо легко підрахувати його довжину - 12 довічних знаків, отже, його інформаційний обсяг дорівнює 12-ти бітам.
Такий спосіб вимірювання кількості інформації називається алфавітним підходом. При цьому вимірюється не зміст інформації з точки зору його новизни і корисності, а розмір несе інформацію повідомлення. При алфавітному підході до визначення кількості інформації одні й ті ж відомості, закодовані по-різному, будуть мати різний інформаційний об'єм. Повідомлення однакової довжини можуть нести абсолютно як абсолютно даремні відомості, так і потрібну інформацію. Приклад: Застосовуючи алфавітний підхід, одержуємо, що інформаційний обсяг слів фиирпбьощ і комп'ютер абсолютно однаковий, а слів учень і учень - різний.
Якщо алфавіт містить 2 i знаків, то кожен з його знаків можна закодувати за допомогою i знаків довічного алфавіту. Таким чином, обсяг інформації I, що міститься у повідомленні довжиною k при використанні алфавіту потужністю 2 i, дорівнює
=k * i біт.
Приклад. Знайдемо інформаційний обсяг слова SOS, записаного в комп'ютерній кодуванні. При кодуванні букв в комп'ютері використовується або алфавіт ASCII (American Standard Code for Information Interchange - американський стандартний код обміну інформацією), що складається з 8 лютого=256 знаків, або алфавіт Unicode, потужність якого 2 16=65536. У слові SOS три букви, отже , його інформаційний об'єм 3 +8=24 або 3 16=48 біт, у залежності від використовуваного кодування.
При алфавітному підході до вимірювання інформації кількість інформації залежить не від змісту, а від розміру тексту та потужності алфавіту. При використанні двійкової системи (алфавіт складається з двох знаків: 0 та 1) кожен двійковий знак несе 1 біт інформації. Сама одиниця виміру інформації «біт» отримала свою назву від англійського сполучення «binary digit» - «двійкова цифра».
Якщо допустити, що всі символи алфавіту зустрічаються в тексті з однаковою частотою (равновероятно), то кількість інформації, яку несе кожен символ, обчислюється за формулою: i=log 2 N, де - N потужність алфавіту.
Застосування алфавітного підходу зручно насамперед при використанні технічних засобів роботи з інформацією. У цьому випадку втрачають сенс поняття «нові - старі», «зрозумілі - незрозумілі» відомості. Алфавітний підхід є об'єктивним способом виміру інформації на відміну від суб'єктивного змістовного підходу. ...