Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Новые рефераты » Корпусні лінгвістика як розділ прикладної лінгвістики

Реферат Корпусні лінгвістика як розділ прикладної лінгвістики





езентативності. Завдання творців корпусу - зібрати якомога більшу кількість текстів, що відносяться до того подмножеству мови, для вивчення якого корпус створюється. Яким би специфічним не був феномен, жоден корпус не може містити всі його реалізації. Тому корпус - це завжди певна вибірка з проблемної області, яка здійснюється на основі деяких критеріїв, що встановлюються дослідником в залежності від завдання. Така вибірка повинна відображати ті чи інші параметри досліджуваного мовного явища в тій же пропорції, що і в мові взагалі або в деякому досліджуваному підмножині мови.

З точки зору відбору текстів в корпус розрізняють збалансовані корпуси і моніторні корпусу. У збалансованих корпусах в корпус включаються тексти, що представляють різні модуси дискурсу (включаючи як письмові, так і усні тексти), різноманітні за жанрами, стилями і тематики. При розробці корпуса встановлюються пропорції, в яких повинні бути представлені тексти різних жанрів, стилів і т.п. Такі корпуси мають фіксований обсяг. Поповнення таких корпусів відбувається тільки після ретельної процедури відбору нових текстів. Моніторні корпуси постійно поповнюються новими текстами на даному мовою, при цьому баланс текстів різних модусів, стилів і жанрів не дотримується. Творці моніторних корпусів вважають, що «статистична» обгрунтованість даних, отриманих з корпусу, буде досягнута за рахунок обсягу корпусу, що обчислюється в мільярдах слів.

Важливим параметром корпусу є його обсяг. Якщо перші корпуси досягали мільйона слів (точніше, слововживань або текстоформ), то обсяг сучасних корпусів обчислюється сотнями мільйонів (наприклад, обсяг Національного корпусу російської мови на даний момент становить близько 360 млн. слововживань) або мільярдами (наприклад, обсяг корпусу англійської мови Bank of English перевищує 2,5 мільярда слів).

Як вже зазначалося, для вирішення різних лінгвістичних завдань необхідно, щоб тексти й окремі мовні одиниці всередині текстів містили додаткову лінгвістичну та металінгвістіческая інформацію - розмітку (анотацію). Анотований корпус набуває такі переваги, як простота використання та багатофункціональність [4, с. 63]. У сучасних корпусах крім метаразметкі (що відображає різну екстралінгвістичну інформацію про текст, включаючи його назву, автора, жанрову приналежність і т.п.), міститься розмітка, що відповідає різним рівням лінгвістичного опису, - морфологічна, синтаксична, фонетична та ін

Взаємодії користувача з корпусом: пошук в корпусі відповідно до запиту користувача забезпечується за допомогою спеціальних програм - корпусних менеджерів. Вони забезпечують сортування результатів пошуку, статистичні підрахунки, складання конкорданси і словников (списків слів, систематизованих деяким чином) на основі корпусу.

Більшість сучасних корпусних менеджерів дозволяють здійснювати пошук різного роду інформації: пошук конкретних словоформ; пошук словоформ по лемі (пошук всіх форм однієї і тієї ж лексеми, які зустрілися в тексті); пошук нерозривних і розривних словосполучень. При наявності відповідної розмітки здійснюється пошук по набору морфологічних ознак (наприклад, пошук всіх словосполучень виду «прийменник по + іменник у місцевому відмінку») та іншої інформації, відповідної рівням лінгвістичної розмітки, представлених в корпусі. Завдяки наявності метаразметкі користувач має можливість створювати свій подкор...


Назад | сторінка 6 з 32 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Прийоми і використання різних видів текстів на уроках англійської мови
  • Реферат на тему: Особливості вживання крилатого виразу-галліцизм медовий місяць в сучасній р ...
  • Реферат на тему: Способи перекладу складних слів з англійської мови на російську в текстах с ...
  • Реферат на тему: Право на пошук, отримання і використання інформації
  • Реферат на тему: Пошук інформації в мережі Інтернет для використання в процесі навчання