пус текстів, відібраних за жанром, тематикою, часом написання і т.п. Результат видачі являє собою конкорданс (безліч контекстів, в якому зустрілося запитувана мовне вираження). Кожен із прикладів забезпечується інформацією про джерело, звідки взято приклад. У ряді корпусів можливо також отримати статистичну інформацію про запитуваній мовному вираженні: його відносну частоту по всьому корпусу, розподіл за жанрами або тимчасовим зрізах, інформацію про частоту його сполучуваності.
Корпуси, як правило, призначені для багаторазового використання багатьма користувачами. Для уніфікації роботи з різними корпусами, для забезпечення «незалежності» корпусних даних від конкретної програмної реалізації інтерфейсу роботи з корпусом розробляються стандарти розмітки текстових корпусів. В даний час виробилися стандарти представлення метаданих, що базуються на описі текстів у рамках проекту Text Encoding Initiative (TEI) і на рекомендаціях EAGLES (Expert Advisory Group on Language Engineering Standards).
.4 Загальна характеристика Національного корпусу російської мови
Корпус - це інформаційно-довідкова система, заснована на зборах текстів на деякій мові в електронній формі. Національний корпус представляє даний мову на певному етапі (або етапах) його існування і в усьому різноманітті жанрів, стилів, територіальних і соціальних варіантів.
Національний корпус створюється фахівцями з корпусних лінгвістиці для наукових досліджень і навчання мови. Більшість великих мов світу вже має свої національні корпусу (розрізняються по повноті і рівню наукової обробки текстів). Загальновизнаним зразком є, зокрема, Британський національний корпус: на нього орієнтовані багато інших сучасні корпуси. Серед корпусів слов'янських мов виділяється також Чеський національний корпус, створений в Карловому університеті Праги.
Національний корпус російської мови розміщений в мережі Інтернет з 2004 року на сайті ruscorpora <# «justify"> · схилення імен;
· відмінювання дієслів;
· лексико-граматичні розряди іменників (конкретні, абстрактні, речові, збірні);
розряди займенників (особисті, поворотні, негативні і т.д.);
корпус усного мовлення, що включає розшифровки магнітофонних записів публічній і приватній усного мовлення, а також транскрипти кінофільмів. Усний корпус зручно використовувати при викладанні:
лінгвістичних дисциплін, таких як «Сучасна російська мова. Лексикологія », тема:« Лексичний склад російської мови: лексика з погляду функціонально-стилістичного розшарування »,« Сучасна російська мова. Орфоепія »,« Основи стилістики »;
дисциплін, пов'язаних з проблемами мовної норми, зокрема, «Російська мова і культура мови», «Синтаксис і стилістика». Корпус живої усної мови містить такі підрозділи:
усне публічне мовлення (можна вибрати мовні жанри, наприклад, бесіда, дискусія, лекція, інтерв'ю, репортаж та ін);
усна непублічна мова (можна вибрати жанри: бесіда, мікродіалог, переказ, розмова, розповідь, суперечка);
мова кіно (можна вибрати кіножанри).
акцентологічні корпус (корпус історії російського наголосу) - тексти, що несуть інформацію про історію російського наголосу (всі тексти п...