Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Новые рефераты » Комп'ютерний аналіз тексту

Реферат Комп'ютерний аналіз тексту





що вони були голодні "і" Ми віддали банани мавпам, тому що вони були перезрілими "схожі за синтаксичній структурі. В одному з них займенник вони відноситься до мавпам, а в іншому - до бананів. Правильне розуміння залежить від знань комп'ютера, якими можуть бути банани і мавпи. За нормами російської мови друге речення некоректно, тому що в ньому займенник посилається не так на Останнім відповідне слово, проте в живої мови таку пропозицію дуже навіть може зустрітися.

В· Вільний порядок слів може призвести до зовсім іншого тлумачення фрази: "Буття визначає свідомість "- хто кого визначає?

В· У російській мові вільний порядок компенсується розвиненою морфологією, службовими словами і знаками пунктуації, але в більшості випадків для комп'ютера це являє додаткову проблему.

В· У промові можуть зустрітися неологізми, наприклад, дієслово "Пятідесятірубліруй" - то є надсилай 50 рублів. Система повинна вміти відрізняти такі випадки від друкарських помилок і правильно їх розуміти.

В· Правильне розуміння омонімів - ще одна проблема. При розпізнаванні мови, крім інших, виникає проблема фонетичних омонімів. У фразі "Сірий вовк в глухому лісі зустрів руду лисицю "виділені слова чуються однаково, і без знання, хто глухий, а хто рудий, не обійтися (Крім того, що лисиця, може бути, рудої, а ліс - глухим, ліс також може бути рудим (переважання кольору листя в лісі), у той час як лисиця може бути глухий, що породжує додаткову проблему, витікає із попередньої).


Глава 3. Програми для комп'ютерного аналізу тексту


3.1 Машинний переклад


Машинний переклад - процес перекладу текстів (письмових, а в ідеалі і усних) з однієї природної мови на іншу за допомогою спеціальної комп'ютерної програми.

Хотілося б відзначити, що замість "машинного перекладу" іноді вживається слово автоматичний, що не впливає на зміст. Однак термін автоматизований переклад має зовсім інше значення - при ньому програма просто допомагає людині перекладати тексти. Автоматизований переклад передбачає такі форми взаємодії як:

1) Частково автоматизований переклад: наприклад, використання перекладачем-людиною комп'ютерних словників.

2) Системи з поділом праці: комп'ютер навчений переводити тільки фрази жорстко заданої структури (але робить це так, щоб виправляти за ним не було потрібно), а все, не вклалися в схему, віддає людині.

В англомовній термінології також розрізняються терміни англ. machine translation, MT (повністю автоматичний переклад) і англ. machine-aided або англ. machine-assisted translation (MAT) (автоматизований), якщо ж треба позначити і те, і інше, пишуть M (A) T.

Якщо ж говорити про якість перекладу, то воно залежить від тематики і стилю вихідного тексту, а також граматичної, синтаксичної та лексичної спорідненості мов, між якими проводиться переведення. Машинний переказ художніх текстів практично завжди виявляється незадовільної якості. Тим не менше, для технічних документів при наявності спеціалізованих машинних словників і деякої налаштування системи на особливості того чи іншого типу текстів можливе отримання переказу прийнятного якості, який потребує лише слабкий редакторської коригуванню. Чим більш формалізований стиль вихідного документа, тим більшої якості перекладу можна чекати. Найкращих результатів при використанні машинного перекладу можна досягти для текстів, написаних в технічному (різні опису та керівництва) і офіційно-діловому стилі.

Застосування машинного перекладу без налаштування на тематику (або з навмисно невірної налаштуванням) служить предметом численних бродять по Інтернету жартів. З розлогих прикладів найбільш відомий текс т "гуртівника Миші "(переклад комп'ютерної документації програмою Poliglossum на основі медичного, комерційного і юридичного словників); з коротких - фраза "My cat has given birth to four kittens, two yellow, one white and one black ", яку перекладач компанії ПРОМТ перетворює на "Моя кішка народила чотирьох кошенят, два жовтих кольору, одного білого і одного афроамериканця ". Головною причиною того, чому програма перевела саме так, було те, що після слова black потрібно було додати kitten, тоді програма переведе правильно: "Моя кішка народила чотирьох кошенят: двох жовтих, одного білого і одного чорного кошеня ".

Найчастіше подібні жарти пов'язані з тим, що програма не розпізнає контекст фрази і переводить терміни дослівно, до того ж не відрізняючи власних імен від звичайних слів. Той же перекладач ПРОМТ перетворює "bra-ket notation "в" примітка Кеті ліфчика "," Lie algebra "- в "алгебру Брехні", "eccentricity vector" - в "вектор оригінальності "," Shawnee Smith "в" індіанець племені Шоні Сміт ". p> Розповівши про якість перекладу, необхідно торкнутися і статистичний переклад.

Статистичний машинний переклад - це різновид машинного перекладу тексту, заснована на порівнянн...


Назад | сторінка 6 з 9 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Переклад текстів комп'ютерних ігор
  • Реферат на тему: Особливості перекладу англійськіх комп'ютерних термінів засобими україн ...
  • Реферат на тему: Переклад комп'ютерних неологізмів
  • Реферат на тему: Особливості перекладу текстів науково-популярного стилю у сфері аудіовізуал ...
  • Реферат на тему: Машинний переклад