>
На вхід графематіке подається файл тексту в Windows-кодуванні. На виході графематіка будує таблицю, що складається з двох стовпців. У першому стовпці стоїть деякий шматок вхідного тексту (виділений за правилами, про які ми скажемо нижче), у другому стовпці стоять графематіческіе дескриптори, що характеризують цей шматок тексту. Наприклад, з тексту В«Іван спавВ» буде побудована таблиця з трьох
Шматок вхідного текстаГрафематіческіе дескриптори ІванЛЕ Бб ПРД1_РЗД ПРБспалЛЕ бб ПРД2
У перший стовпець завжди поміщається частина вхідного тексту, якщо ця частина не є послідовністю з м'яких роздільників (пробіл, табуляція). В останньому випадку використовуються інші символи, номери яких включені в опис мовою idl. br/>
2.2.3 Графематіческіе дескриптори
Наведемо тепер всі графематіческіе дескриптори. У кожного графематіческого дескриптора є дві назви: кириличне і латинське. Перше використовується у другому стовпці графематіческой таблиці, друге всередині програми. Спочатку наведемо головні дескриптори, один з яких обов'язково повинен бути присутнім на кожному рядку графематіческой таблиці. br/>
Кир. НазваніеОб'ясненіеПрімери ЛЕрусская лексема, присвоюється послідовностям, що складається з кириллицыИванИЛЕиностранная лексема, присвоюється послідовностям з латініциJohnРЗДразделітель. В«* ',' = ',' _'ЗПРзнак Пунктуації, присвоюється послідовностям, що складається з однакових знаків пунктуації В«.В», '[', ']', '(', ')', '-', ':', ';' ЦКціфровой комплекс, присвоюється послідовностям, що складається з ціфр1234ЦБКціфро-буквений комплекс, присвоюється послідовностям, що складається з цифр і букв34h??? складний вузол, присвоюється послідовностям, що не володіє перерахованими вище ознаками
Різновиди дескриптора РЗД
Кир. НазваниеОбъяснениеПРБстрока прогалин чи табуляційКСТпрізнак кінця строкіПАРсімвол параграфаПСнулевой символ
Різновиди дескриптора ЗПР
Кир. НазваниеОбъяснениеПримерыОТКоткрывающая дужка '{', '[', '(' ЗАКзакривающая дужка '}', ']', ')' ДЕФдефіс-
Різновиди дескриптора ЗПР і РЗД
Кир. НазваниеОбъяснениеДЗПРпоследовательность однакових символів, довжина якої більше 20МНЖпоследовательность однакових символів, довжина якої більше 1
Різновиди дескриптора ЛЄ і мулі
Кир. НазваниеОбъяснениеПримерыббпризнак того, що всі символи лексеми - малиемамаБбпрізнак того, що перший символ лексеми - великий; МамаББпрізнак того, що всі символи лексеми - большіеМАМА