х ASCII спочатку був розроблений варіант кодування - КОИ - 7 (код обміну інформацією 7-бітний). Розташування символів у другій половині таблиці цієї кодування різко відрізняється від прийнятого фірмою IBM, що ускладнює використання зарубіжного програмного забезпечення на вітчизняних машинах.
В даний час знаходять широке застосування і інші види кодування. Так, у зв'язку з масовим використанням операційних систем та інших продуктів компанії Microsoft в нашій країні знайшла застосування кодування символів російської мови, відома як кодування Windows - 1251. Ця кодування використовується на ПК, що працюють на платформі Windows.
Інша поширена кодування носить назву КОИ - 8 (код обміну інформацією восьмизначний). Сьогодні кодування КОИ - 8 має широке поширення в комп'ютерних мережах на території Росії і в деяких службах російського сектора Інтернету. Зокрема, в нашій країні вона є стандартом в повідомленнях електронної пошти і телеконференцій.
Останнім часом все більшого поширення набуває універсальна система кодування текстових даних - UNICODE. У даній системі символи кодуються НЕ восьмирозрядних двійковими числами, а 16-розрядними числами. Шістнадцять розрядів дозволяють забезпечити унікальні коди для 65536 різних символів - цього достатньо для розміщення в одній таблиці всіх широко вживаних мов.
Символьна інформація в ЕОМ
На відміну від звичайної словесної форми, прийнятої в письмовому вигляді, символьна інформація зберігається і обробляється в пам'яті ЕОМ у формі цифрового коду. Наприклад, можна позначити кожну букву числами, відповідними її порядковому номеру в алфавіті: А - 01, Б - 02, В - 03, ..., Ю - 31, Я - 32. Точно так само можна домовитися позначати точку числом 33, кому- 34 і т.д. Так як в пристроях автоматичної обробки інформації використовуються двійкові коди, то позначення букв треба перевести в двійкову систему. Тоді букви будуть позначатися таким чином: А - 000 001, Б - 000 010, В - 000 011, Г - 000 100, ..., Е - 011 110, Ю - 011111, Я - 100000. При такому кодуванні будь-яке слово можна представити у вигляді послідовності кодових груп, складених з 0 і 1. Наприклад, слово ЕОМ виглядає так: 011110000011001110.
При перетворенні символів (знаків) в цифровий код між множинами символів та кодів повинно мати місце взаимнооднозначное відповідність, тобто різним символам мають бути призначені різні цифрові коди, і навпаки. Ця умова є єдиною необхідною вимогою при побудові схеми перетворення символів у числа. Однак існує ряд практичних угод, прийнятих при побудові схеми перетворення виходячи з міркувань наочності, ефективності, стандартизації. Наприклад, яке б число ні призначили коду для знаку Про (не слід плутати з числом 0), знаку 1 зручно призначити число, на одиницю більше, ніж код О, і т.д. до знака 9. Аналогічна ситуація виникає і при кодуванні букв алфавіту: код для Б на одиницю більше коду для А, а код для В на одиницю більше коду для Б і т. д. Таким чином, з міркувань наочності і легкості запам'ятовування доцільно безлічі символів , упорядкованих за будь-якою ознакою (наприклад, лексико-графічному), кодувати також за допомогою впорядкованої послідовності чисел.
Іншим важливим моментом при організації кодування символьної інформації є ефективне використання оперативної пам'яті ЕОМ. Так як загальновживаними є прибл...