всередині ЕОМ це число буде представлено двійковим числом 01000001В), латинська буква С - числом 67D, латинська буква М - 77D і т.д. Таким чином, слово «САМАРА», написане великими латинськими літерами буде циркулювати всередині ЕОМ у вигляді цифр.
Якщо говорити точніше, то всередині ЕОМ дане слово циркулює у вигляді двійкових чисел: 01000011В - 01000001В - 01001101В - 01000001В - 01010000В - 01000001В. Аналогічно кодуються цифри (наприклад, 1 - 49D, 2 - 59D) і символи (наприклад,! - 33D, + - 43D). Поряд з алфавітно-цифровими символами в кодової таблиці закодовані керуючі сигнали. Наприклад, код 13D змушує друкувальну головку принтера повернутися до початку поточного рядка, а код 10D переміщує папір, заправлену в принтер, на один рядок вперед. Кодова таблиця може бути представлена ??не тільки за допомогою десяткового СС, але і за допомогою шістнадцятковій СС. Ще раз звертаємо увагу на той факт, що всередині ЕОМ циркулюють сигнали, представлені в двійковій системі числення, а в кодової таблиці для більшої зручності читання користувачем - в десяткового або шістнадцятковій СС. Кожна буква, цифра, знак пунктуації або керуючий сигнал кодуються восьмирозрядним двійковим числом. За допомогою восьмирозрядного числа (однобайтового числа) можна представити (закодувати) 256 довільних символів - букв, цифр і взагалі графічних образів.
У різних країнах, на різних моделях ЕОМ, в різних операційних системах можуть використовуватися і різні варіанти другої половини кодової таблиці (їх називають розширеннями ASCII). Наприклад, таблиця, яка використовується в операційній системі MS-DOS, називається СР - 866. При роботі в операційній системі Windows використовується таблиця кодів СР - 1251, в якій кодування латинських букв збігається з кодуванням таблиць СР - 866 і ASCII, a друга половина таблиці має власну розкладку (кодування) символів. Тому слово «САМАРА», написане заголовними російськими літерами, буде мати всередині ЕОМ інше уявлення.
Таким чином, зовні однакове слово (наприклад, «САМАРА») всередині ЕОМ може бути представлено різним чином. Природно, це викликає певні незручності. При роботі в Інтернет національний текст часом стає нечитабельним. Найбільш вірогідною причиною в цьому випадку є розбіжність кодувань другої половини кодових таблиць. Зауважимо, що якщо для складання листів, що відправляються електронною поштою, використовується перша половина кодової таблиці (латиниця), то проблеми з кодуванням не виникають.
Загальним недоліком усіх однобайтових кодових таблиць (в них для кодування використовуються восьмирозрядні двійкові числа) є відсутність в коді символу якої інформації, яка підказує машині, яка в даному випадку використовується кодова таблиця.
Співтовариством фірм Unicode запропонована в якості стандарту інша система кодування символів.
У цій системі для подання (кодування) одного символу використовуються два байти (16 бітів), і це дозволяє включити в код символу інформацію про те, якому мові належить символ і як його треба відтворювати на екрані монітора або на принтері. Два байти дозволяють закодувати 65 536 символів. Правда, обсяг інформації, займаної одним і тим же текстом, збільшиться вдвічі. Зате тексти завжди будуть «читаються» незалежно від використаного національної мови і операційної системи.
III. Файлова система